uniq: Linuxový příkaz k nalezení duplicitního textu

Někdy je pravděpodobné, že máte velmi dlouhé textové soubory, mezi kterými je obtížné najít určité vzory, resp řádky nebo slova, která jsou duplicitní, nebo možná existuje spousta malých textových souborů, kde chcete snáze spárovat, a dokonce použít rouru a spárovat výstup příkazu. Také, uniq je příkaz co to hledáš.

S uniq můžete hledat nadbytečné informace velmi jednoduchým způsobem. Kromě toho vám také umožní tyto duplikáty v případě potřeby odstranit. A v tomto tutoriálu uvidíte několik příkladů příkazů, které se vám mohou hodit. Pamatujte, že je standardně nainstalován ve velké většině distribucí, takže nebudete muset instalovat balíček...

Nejprve se podívejme na příklad, abychom pochopili základy příkazu uniq a co dělá a co nedělá. Pro ejemplo, představte si, že vytvoříte textový soubor s názvem test.txta dovnitř vložíte několik opakovaných frází nebo slov, například opakování tří řádků «Ahoj toto je test» a poté s ním použijte uniq:

nano prueba.txt

uniq prueba.txt

No, v tom případě, výstup příkazu bude jednoduše:

Salida:

Hola, esto es una prueba

To znamená, že vložte jeden řádek «Ahoj toto je test» odstranění dalších 2, které jsou stejné. Ale pozor, pokud znovu použijete cat k zobrazení originálu, uvidíte, že nebyly odstraněny ze souboru, prostě je odstranil z výstupu:

cat prueba.txt

jehož výstup by byl:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Ale příkaz uniq má k dispozici mnohem více možností. Například vám to může říct kolikrát se řádek opakuje, s uvedením počtu opakování na začátku řádku. Pro to:

uniq -c prueba.txt

Můžete také jen tisknout opakované řádkya ignorujte ty, které se neopakují:

uniq -d prueba.txt

Nebo ty, které nejsou duplikovány s volbou -u:

uniq -u prueba.txt

Použití rozlišuje velká a malá písmena a rozlišujte malá a velká písmena, můžete použít volbu -i:

uniq -i prueba.txt

Dobře a jak by se to dalo udělat vytvořte soubor pouze s jedinečnými řádky, čímž se odstraní všechny duplikáty najednou. No, je to stejně jednoduché jako pomocí roury k přenosu výstupu uniq do nového textového souboru:

uniq prueba.txt > unicas.txt


Zanechte svůj komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *

*

*

  1. Za data odpovídá: AB Internet Networks 2008 SL
  2. Účel údajů: Ovládací SPAM, správa komentářů.
  3. Legitimace: Váš souhlas
  4. Sdělování údajů: Údaje nebudou sděleny třetím osobám, s výjimkou zákonných povinností.
  5. Úložiště dat: Databáze hostovaná společností Occentus Networks (EU)
  6. Práva: Vaše údaje můžete kdykoli omezit, obnovit a odstranit.