uniq: Εντολή Linux για εύρεση διπλού κειμένου

Μερικές φορές, είναι πιθανό να έχετε πολύ μεγάλα αρχεία κειμένου μεταξύ των οποίων είναι δύσκολο να βρείτε ορισμένα μοτίβα ή γραμμές ή λέξεις που είναι διπλότυπες, ή ίσως υπάρχουν ένα σωρό μικρά αρχεία κειμένου στα οποία θέλετε να ταιριάξετε πιο εύκολα, ακόμα και να χρησιμοποιήσετε ένα σωλήνα και να ταιριάξετε την έξοδο μιας εντολής. Επισης, uniq είναι η εντολή τι το ψάχνεις.

Με το uniq μπορείς αναζητήστε περιττές πληροφορίες με πολύ απλό τρόπο. Επιπλέον, θα σας επιτρέψει επίσης να αφαιρέσετε αυτά τα διπλότυπα εάν χρειαστεί. Και, σε αυτό το σεμινάριο, θα δείτε μερικά παραδείγματα της εντολής που μπορεί να σας φανούν χρήσιμα. Να θυμάστε ότι είναι εγκατεστημένο από προεπιλογή στη συντριπτική πλειοψηφία των διανομών, επομένως δεν θα χρειαστεί να εγκαταστήσετε το πακέτο...

Λοιπόν, πρώτα απ 'όλα, ας δούμε ένα παράδειγμα για να κατανοήσουμε τα βασικά της εντολής uniq και τι κάνει και τι όχι. Για παράδειγμα, φανταστείτε ότι δημιουργείτε ένα αρχείο κειμένου που ονομάζεται test.txt, και μέσα βάζετε πολλές επαναλαμβανόμενες φράσεις ή λέξεις, όπως η επανάληψη τριών γραμμών «Γεια σας αυτό είναι ένα τεστ» και μετά χρησιμοποιήστε το uniq μαζί του:

nano prueba.txt

uniq prueba.txt

Λοιπόν, σε αυτή την περίπτωση, την έξοδο της εντολής θα είναι απλά:

Salida:

Hola, esto es una prueba

Δηλαδή, βάλε μια γραμμή «Γεια σας αυτό είναι ένα τεστ» εξαλείφοντας τα άλλα 2 που είναι ίδια. Αλλά προσέξτε, εάν χρησιμοποιήσετε ξανά το cat για να δείτε το πρωτότυπο, θα δείτε ότι δεν έχουν αφαιρεθεί από το αρχείο, απλώς τα έχει αφαιρέσει από την έξοδο:

cat prueba.txt

του οποίου η έξοδος θα ήταν:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Αλλά η εντολή uniq έχει πολλές περισσότερες διαθέσιμες επιλογές. Για παράδειγμα, μπορεί να σας πει πόσες φορές επαναλαμβάνεται μια γραμμή, υποδεικνύοντας στην αρχή της γραμμής τον αριθμό των επαναλήψεων. Γι 'αυτό:

uniq -c prueba.txt

Θα μπορούσατε επίσης απλά εκτύπωση επαναλαμβανόμενων γραμμών, και αγνοήστε τα μη επαναλαμβανόμενα:

uniq -d prueba.txt

Ή αυτά που δεν είναι διπλότυπα με την επιλογή -u:

uniq -u prueba.txt

Για χρήση διάκριση πεζών-κεφαλαίων και να κάνετε διάκριση πεζών-κεφαλαίων, μπορείτε να χρησιμοποιήσετε την επιλογή -i:

uniq -i prueba.txt

Εντάξει, και πώς θα μπορούσε να γίνει δημιουργήστε ένα αρχείο με μόνο τις μοναδικές γραμμές, εξαλείφοντας όλα τα διπλότυπα ταυτόχρονα. Λοιπόν, είναι τόσο απλό όσο η χρήση ενός σωλήνα για τη διοχέτευση της εξόδου του uniq σε ένα νέο αρχείο κειμένου:

uniq prueba.txt > unicas.txt


Αφήστε το σχόλιό σας

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται με *

*

*

  1. Υπεύθυνος για τα δεδομένα: AB Internet Networks 2008 SL
  2. Σκοπός των δεδομένων: Έλεγχος SPAM, διαχείριση σχολίων.
  3. Νομιμοποίηση: Η συγκατάθεσή σας
  4. Κοινοποίηση των δεδομένων: Τα δεδομένα δεν θα κοινοποιούνται σε τρίτους, εκτός από νομική υποχρέωση.
  5. Αποθήκευση δεδομένων: Βάση δεδομένων που φιλοξενείται από τα δίκτυα Occentus (ΕΕ)
  6. Δικαιώματα: Ανά πάσα στιγμή μπορείτε να περιορίσετε, να ανακτήσετε και να διαγράψετε τις πληροφορίες σας.