uniq: Linux komanda, lai atrastu teksta dublikātu

Dažreiz ir iespējams, ka jums ir ļoti gari teksta faili, starp kuriem ir grūti atrast noteiktus modeļus vai rindas vai vārdi, kas tiek dublēti, vai varbūt ir virkne mazu teksta failu, kurus vēlaties vieglāk saskaņot un pat izmantot cauruli un saskaņot komandas izvadi. Arī, uniq ir komanda ko tu to meklē.

Ar uniq jūs varat meklēt lieku informāciju ļoti vienkāršā veidā. Turklāt tas arī ļaus jums noņemt šos dublikātus, ja nepieciešams. Un šajā apmācībā jūs redzēsit dažus komandas piemērus, kas jums varētu noderēt. Atcerieties, ka tas ir instalēts pēc noklusējuma lielākajā daļā izplatījumu, tāpēc jums nebūs jāinstalē pakotne...

Vispirms apskatīsim piemēru, lai saprastu komandas uniq pamatus un to, ko tā dara un ko nedara. Priekš ejemplo, iedomājieties, ka izveidojat teksta failu ar nosaukumu test.txt, un iekšpusē ievietojat vairākas atkārtotas frāzes vai vārdus, piemēram, atkārtojot trīs rindiņas «Sveiki, šis ir tests» un pēc tam kopā ar to izmantojiet uniq:

nano prueba.txt

uniq prueba.txt

Nu tādā gadījumā komandas izvade būs vienkārši:

Salida:

Hola, esto es una prueba

Tas ir, ielieciet vienu rindiņu «Sveiki, šis ir tests» izslēdzot pārējos 2, kas ir vienādi. Taču esiet piesardzīgs, ja jūs vēlreiz izmantojat cat, lai redzētu oriģinālu, jūs redzēsiet, ka tie nav noņemti no faila, tas vienkārši ir noņēmis tos no izvades:

cat prueba.txt

kura izvade būtu:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Bet komandai uniq ir pieejamas daudz vairāk iespēju. Piemēram, tas var jums pastāstīt rindas atkārtošanās reižu skaits, rindas sākumā norādot atkārtojumu skaitu. Par to:

uniq -c prueba.txt

Jūs varētu arī vienkārši drukāt atkārtotas rindas, un ignorēt neatkārtotos:

uniq -d prueba.txt

Vai arī tie, kas nav dublēti ar opciju -u:

uniq -u prueba.txt

Izmantot reģistrjutīgs un esiet reģistrjutīgs, varat izmantot opciju -i:

uniq -i prueba.txt

Labi, un kā to varētu izdarīt izveidot failu tikai ar unikālajām rindām, vienlaikus novēršot visus dublikātus. Tas ir tik vienkārši, kā izmantot cauruli, lai uniq izvadi pārsūtītu uz jaunu teksta failu:

uniq prueba.txt > unicas.txt


Atstājiet savu komentāru

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti ar *

*

*

  1. Atbildīgais par datiem: AB Internet Networks 2008 SL
  2. Datu mērķis: SPAM kontrole, komentāru pārvaldība.
  3. Legitimācija: jūsu piekrišana
  4. Datu paziņošana: Dati netiks paziņoti trešām personām, izņemot juridiskus pienākumus.
  5. Datu glabāšana: datu bāze, ko mitina Occentus Networks (ES)
  6. Tiesības: jebkurā laikā varat ierobežot, atjaunot un dzēst savu informāciju.