uniq: ukaz Linux za iskanje podvojenega besedila

Včasih je verjetno, da imate zelo dolge besedilne datoteke, med katerimi je težko najti določene vzorce oz vrstice ali besede, ki so podvojene, ali morda obstaja kup majhnih besedilnih datotek, kjer želite lažje povezati in celo uporabiti cev in uskladiti izhod ukaza. prav tako uniq je ukaz kaj iščeš.

Z uniqom lahko poiščite odvečne informacije na zelo preprost način. Poleg tega vam bo omogočil tudi odstranitev teh dvojnikov, če boste morali. In v tej vadnici boste videli nekaj primerov ukaza, ki se vam bodo morda zdeli koristni. Ne pozabite, da je privzeto nameščen v veliki večini distribucij, tako da vam ne bo treba namestiti paketa ...

No, najprej poglejmo primer, da razumemo osnove ukaza uniq in kaj počne in česa ne. Za ejemplo, predstavljajte si, da ustvarite besedilno datoteko z imenom test.txt, v notranjost pa vstavite več ponavljajočih se stavkov ali besed, na primer ponavljanje treh vrstic «Pozdravljeni, to je test» in nato z njim uporabite uniq:

nano prueba.txt

uniq prueba.txt

No, v tem primeru, izhod ukaza bo preprosto:

Salida:

Hola, esto es una prueba

To pomeni, da vstavite eno vrstico «Pozdravljeni, to je test» izločanje ostalih 2 enakih. Vendar pozor, če za ogled izvirnika znova uporabite cat, boste videli, da niso bili odstranjeni iz datoteke, ampak jih je preprosto odstranil iz izhoda:

cat prueba.txt

katerega rezultat bi bil:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Toda ukaz uniq ima na voljo veliko več možnosti. Na primer, vam lahko pove kolikokrat se vrstica ponovi, ki na začetku vrstice označuje število ponovitev. Za to:

uniq -c prueba.txt

Lahko bi tudi samo natisnite ponavljajoče se vrsticein prezrite neponovljive:

uniq -d prueba.txt

Ali pa tiste, ki niso podvojene z možnostjo -u:

uniq -u prueba.txt

Za uporabo razlikuje med velikimi in malimi črkami in bodite občutljivi na velike in male črke, lahko uporabite možnost -i:

uniq -i prueba.txt

Ok, in kako bi se to dalo narediti ustvarite datoteko samo z edinstvenimi vrsticami, odpravlja vse dvojnike naenkrat. No, to je tako preprosto kot uporaba cevi za cevovod izhod uniq v novo besedilno datoteko:

uniq prueba.txt > unicas.txt


Pustite svoj komentar

Vaš e-naslov ne bo objavljen. Obvezna polja so označena z *

*

*

  1. Odgovoren za podatke: AB Internet Networks 2008 SL
  2. Namen podatkov: Nadzor neželene pošte, upravljanje komentarjev.
  3. Legitimacija: Vaše soglasje
  4. Sporočanje podatkov: Podatki se ne bodo posredovali tretjim osebam, razen po zakonski obveznosti.
  5. Shranjevanje podatkov: Zbirka podatkov, ki jo gosti Occentus Networks (EU)
  6. Pravice: Kadar koli lahko omejite, obnovite in izbrišete svoje podatke.