uniq: Linuxi käsk dubleeritud teksti leidmiseks

Mõnikord on tõenäoline, et teil on väga pikki tekstifaile, mille hulgast on raske leida teatud mustreid või read või sõnad, mis on dubleeritud, või võib-olla on hunnik väikeseid tekstifaile, mida soovite hõlpsamini sobitada ja isegi kasutada toru ja sobitada käsu väljundit. Samuti, uniq on käsk mida sa otsid.

Unikaalsega saate otsige üleliigset teavet väga lihtsal viisil. Lisaks võimaldab see vajaduse korral ka need duplikaadid eemaldada. Ja selles õpetuses näete mõningaid näiteid käsust, mis võivad teile kasulikuks osutuda. Pidage meeles, et see on vaikimisi installitud enamikus distributsioonides, nii et te ei pea paketti installima...

Noh, kõigepealt vaatame näidet, et mõista uniq-käsu põhitõdesid ja seda, mida see teeb ja mida mitte. Sest ejemplo, kujutage ette, et loote tekstifaili nimega test.txt, ja sisestate mitu korduvat fraasi või sõna, näiteks korrates kolme rida «Tere, see on test» ja seejärel kasutage koos sellega unikaalset:

nano prueba.txt

uniq prueba.txt

No sel juhul käsu väljund oleks lihtsalt:

Salida:

Hola, esto es una prueba

See tähendab, pange üks rida «Tere, see on test» välistades ülejäänud 2, mis on samad. Kuid olge ettevaatlik, kui kasutate originaali vaatamiseks uuesti cat, näete, et neid pole failist eemaldatud, vaid ta on need lihtsalt väljundist eemaldanud:

cat prueba.txt

mille väljund oleks:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Kuid käsul uniq on saadaval palju rohkem võimalusi. Näiteks võib see teile öelda rida korduste arv, mis näitab rea alguses korduste arvu. Selle eest:

uniq -c prueba.txt

Võiksid ka lihtsalt printida korduvaid riduja ignoreerige mittekorduvaid:

uniq -d prueba.txt

Või need, mida ei dubleerita valikuga -u:

uniq -u prueba.txt

Kasutamiseks tõstutundlik ja olge tõstutundlik, võite kasutada suvandit -i:

uniq -i prueba.txt

Ok, ja kuidas seda teha saaks luua fail ainult ainulaadsete ridadega, kõrvaldades kõik duplikaadid korraga. Noh, see on sama lihtne kui toru abil uniqi väljund uude tekstifaili suunamiseks:

uniq prueba.txt > unicas.txt


Jäta oma kommentaar

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on tähistatud *

*

*

  1. Andmete eest vastutav: AB Internet Networks 2008 SL
  2. Andmete eesmärk: Rämpsposti kontrollimine, kommentaaride haldamine.
  3. Seadustamine: teie nõusolek
  4. Andmete edastamine: andmeid ei edastata kolmandatele isikutele, välja arvatud juriidilise kohustuse alusel.
  5. Andmete salvestamine: andmebaas, mida haldab Occentus Networks (EL)
  6. Õigused: igal ajal saate oma teavet piirata, taastada ja kustutada.