uniq: Linux-Befehl, um doppelten Text zu finden

Manchmal ist es wahrscheinlich, dass Sie sehr lange Textdateien haben, in denen es schwierig ist, bestimmte Muster oder Muster zu finden Zeilen oder Wörter, die dupliziert werden, oder vielleicht gibt es eine Reihe kleiner Textdateien, in denen Sie einfacher übereinstimmen möchten, und verwenden Sie sogar eine Pipe und passen Sie die Ausgabe eines Befehls an. Sowie, uniq ist der Befehl was suchst du danach.

Mit uniq ist das möglich Suchen Sie nach redundanten Informationen auf ganz einfache Weise. Darüber hinaus können Sie diese Duplikate bei Bedarf entfernen. Und in diesem Lernprogramm sehen Sie einige Beispiele für den Befehl, die Sie möglicherweise nützlich finden. Denken Sie daran, dass es in den meisten Distributionen standardmäßig installiert ist, sodass Sie das Paket nicht installieren müssen ...

Sehen wir uns zunächst ein Beispiel an, um die Grundlagen des Befehls uniq zu verstehen und zu verstehen, was er tut und was nicht. Für ejemplo, stellen Sie sich vor, Sie erstellen eine Textdatei namens test.txt, und darin fügen Sie mehrere wiederholte Sätze oder Wörter ein, z. B. die Wiederholung von drei Zeilen «Hallo, das ist ein Test» und dann uniq damit verwenden:

nano prueba.txt

uniq prueba.txt

Also in diesem Fall, die Ausgabe des Befehls wird einfach sein:

Salida:

Hola, esto es una prueba

Das heißt, setzen Sie eine einzelne Zeile «Hallo, das ist ein Test» Eliminieren der anderen 2, die gleich sind. Aber Vorsicht, wenn Sie cat erneut verwenden, um das Original zu sehen, werden Sie sehen, dass sie nicht aus der Datei entfernt wurden, sondern sie wurden einfach aus der Ausgabe entfernt:

cat prueba.txt

dessen Ausgabe wäre:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Aber der uniq-Befehl hat noch viel mehr Optionen zur Verfügung. Zum Beispiel kann es Ihnen sagen wie oft eine Zeile wiederholt wird, die am Anfang der Zeile die Anzahl der Wiederholungen angibt. Dafür:

uniq -c prueba.txt

Du könntest auch einfach wiederholte Zeilen drucken, und ignorieren Sie die nicht wiederholten:

uniq -d prueba.txt

Oder diejenigen, die nicht mit der Option -u dupliziert werden:

uniq -u prueba.txt

Zu verwenden Groß- und Kleinschreibung und achten Sie auf Groß- und Kleinschreibung, Sie können die Option -i verwenden:

uniq -i prueba.txt

Ok, und wie könnte es getan werden Erstellen Sie eine Datei mit nur den eindeutigen Zeilen, wodurch alle Duplikate auf einmal entfernt werden. Nun, es ist so einfach wie die Verwendung einer Pipe, um die Ausgabe von uniq in eine neue Textdatei zu leiten:

uniq prueba.txt > unicas.txt


Hinterlasse einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert mit *

*

*

  1. Verantwortlich für die Daten: AB Internet Networks 2008 SL
  2. Zweck der Daten: Kontrolle von SPAM, Kommentarverwaltung.
  3. Legitimation: Ihre Zustimmung
  4. Übermittlung der Daten: Die Daten werden nur durch gesetzliche Verpflichtung an Dritte weitergegeben.
  5. Datenspeicherung: Von Occentus Networks (EU) gehostete Datenbank
  6. Rechte: Sie können Ihre Informationen jederzeit einschränken, wiederherstellen und löschen.