уник: Линук команда за проналажење дупликата текста

Понекад је вероватно да имате веома дугачке текстуалне датотеке међу којима је тешко пронаћи одређене обрасце или линије или речи које се дуплирају, или можда постоји гомила малих текстуалних датотека у којима желите да лакше упарите, па чак и да користите цев и упарите излаз команде. Такође, уник је команда шта то тражиш.

Са уник-ом можете потражите сувишне информације на врло једноставан начин. Поред тога, такође ће вам омогућити да уклоните те дупликате ако је потребно. И, у овом водичу, видећете неке примере команде које би вам могле бити корисне. Запамтите да је он подразумевано инсталиран у великој већини дистрибуција, тако да нећете морати да инсталирате пакет...

Па, пре свега, хајде да видимо пример да разумемо основе уник команде и шта она ради, а шта не ради. За ејемпло, замислите да креирате текстуалну датотеку под називом тест.ткт, а унутра ставите неколико поновљених фраза или речи, као што је понављање три реда «Здраво, ово је тест» а затим користите уник са њим:

nano prueba.txt

uniq prueba.txt

Па, у том случају, излаз команде биће једноставно:

Salida:

Hola, esto es una prueba

То јест, ставите један ред «Здраво, ово је тест» елиминишући друга 2 која су иста. Али пазите, ако поново користите цат да видите оригинал, видећете да нису уклоњени из датотеке, већ их је једноставно уклонила из излаза:

cat prueba.txt

чији би излаз био:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Али команда уник има много више доступних опција. На пример, може вам рећи колико пута се ред понавља, означавајући на почетку реда број понављања. За то:

uniq -c prueba.txt

Можете и само штампати поновљене редове, и занемарите оне које се не понављају:

uniq -d prueba.txt

Или оне које нису дуплиране са -у опцијом:

uniq -u prueba.txt

За употребу разликују велика и мала слова и да будете осетљиви на велика и мала слова, можете користити опцију -и:

uniq -i prueba.txt

Ок, и како би се то могло урадити креирајте датотеку само са јединственим линијама, елиминишући све дупликате одједном. Па, једноставно је као да користите цев за слање излаза уник у нову текстуалну датотеку:

uniq prueba.txt > unicas.txt


Оставите свој коментар

Ваша емаил адреса неће бити објављена. Обавезна поља су означена са *

*

*

  1. Odgovorni za podatke: AB Internet Networks 2008 SL
  2. Сврха података: Контрола нежељене поште, управљање коментарима.
  3. Легитимација: Ваш пристанак
  4. Комуникација података: Подаци се неће преносити трећим лицима, осим по законској обавези.
  5. Похрана података: База података коју хостује Оццентус Нетворкс (ЕУ)
  6. Права: У било ком тренутку можете ограничити, опоравити и избрисати своје податке.