uniq: Linux naredba za pronalaženje duplikata teksta

Ponekad je vjerovatno da imate jako dugačke tekstualne datoteke među kojima je teško pronaći određene obrasce ili linije ili riječi koje su duplicirane, ili možda postoji gomila malih tekstualnih datoteka u kojima želite lakše upariti, pa čak i koristiti cijev i uskladiti izlaz naredbe. isto tako, uniq je komanda šta to tražiš.

Sa uniq-om možete potražite suvišne informacije na vrlo jednostavan način. Osim toga, također će vam omogućiti da uklonite te duplikate ako je potrebno. I, u ovom vodiču, vidjet ćete neke primjere naredbe koje bi vam mogle biti korisne. Zapamtite da je instaliran po defaultu u velikoj većini distribucija, tako da nećete morati instalirati paket...

Pa, prije svega, pogledajmo primjer kako bismo razumjeli osnove naredbe uniq i šta ona radi, a šta ne radi. Za ejemplo, zamislite da kreirate tekstualnu datoteku pod nazivom test.txt, a unutra stavite nekoliko ponovljenih fraza ili riječi, kao što je ponavljanje tri reda «Zdravo, ovo je test» i zatim koristite uniq s njim:

nano prueba.txt

uniq prueba.txt

Pa, u tom slučaju, izlaz naredbe bit će jednostavno:

Salida:

Hola, esto es una prueba

Odnosno, stavite jedan red «Zdravo, ovo je test» eliminišući druga 2 koja su ista. Ali pazite, ako ponovo koristite cat da vidite original, vidjet ćete da oni nisu uklonjeni iz datoteke, već ih je jednostavno uklonila iz izlaza:

cat prueba.txt

čiji bi izlaz bio:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Ali naredba uniq ima mnogo više dostupnih opcija. Na primjer, može vam reći koliko puta se red ponavlja, označavajući na početku reda broj ponavljanja. Za to:

uniq -c prueba.txt

Mogao bi i samo štampati ponovljene redove, a zanemarite one koje se ne ponavljaju:

uniq -d prueba.txt

Ili one koje nisu duplicirane opcijom -u:

uniq -u prueba.txt

Za korištenje razlikuju velika i mala slova i budite osjetljivi na velika i mala slova, možete koristiti opciju -i:

uniq -i prueba.txt

Ok, i kako bi se to moglo uraditi kreirajte datoteku samo sa jedinstvenim linijama, eliminirajući sve duplikate odjednom. Pa, to je jednostavno kao korištenje cijevi za provođenje izlaza uniq u novu tekstualnu datoteku:

uniq prueba.txt > unicas.txt


Ostavite komentar

Vaša e-mail adresa neće biti objavljena. Obavezna polja su označena sa *

*

*

  1. Odgovoran za podatke: AB Internet Networks 2008 SL
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obavezi.
  5. Pohrana podataka: Baza podataka koju hostuje Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.