uniq: Linux команда за намиране на дублиран текст

Понякога е вероятно да имате много дълги текстови файлове, сред които е трудно да намерите определени модели или редове или думи, които се дублират, или може би има куп малки текстови файлове, където искате да съпоставите по-лесно и дори да използвате тръба и да съпоставите изхода на команда. както и uniq е командата какво го търсиш.

С uniq можете потърсете излишна информация по много прост начин. В допълнение, той също така ще ви позволи да премахнете тези дубликати, ако е необходимо. И в този урок ще видите някои примери за командата, които може да ви бъдат полезни. Не забравяйте, че той е инсталиран по подразбиране в по-голямата част от дистрибуции, така че няма да ви се налага да инсталирате пакета...

Е, първо, нека видим пример, за да разберем основите на командата uniq и какво прави и какво не. За ejemplo, представете си, че създавате текстов файл, наречен test.txt, а вътре поставяте няколко повтарящи се фрази или думи, като например повтаряне на три реда «Здравейте това е тест» и след това използвайте uniq с него:

nano prueba.txt

uniq prueba.txt

Е, в такъв случай, изходът на командата ще бъде просто:

Salida:

Hola, esto es una prueba

Тоест поставете един ред «Здравейте това е тест» елиминиране на другите 2, които са еднакви. Но внимавайте, ако използвате cat отново, за да видите оригинала, ще видите, че те не са премахнати от файла, а просто ги е премахнал от изхода:

cat prueba.txt

чийто изход би бил:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Но командата uniq има много повече налични опции. Например, може да ви каже колко пъти се повтаря ред, показващ в началото на реда броя на повторенията. За него:

uniq -c prueba.txt

Можете също така просто отпечатайте повтарящи се редовеи игнорирайте неповтарящите се:

uniq -d prueba.txt

Или тези, които не се дублират с опцията -u:

uniq -u prueba.txt

Да се ​​използва с отчитане на главни и малки букви и да бъдете чувствителни към главните букви, можете да използвате опцията -i:

uniq -i prueba.txt

Добре, и как може да се направи създайте файл само с уникалните редове, премахвайки всички дубликати наведнъж. Е, това е толкова просто, колкото да използвате тръба за прехвърляне на изхода на uniq към нов текстов файл:

uniq prueba.txt > unicas.txt


Оставете вашия коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

*

  1. Отговорник за данните: AB Internet Networks 2008 SL
  2. Предназначение на данните: Контрол на СПАМ, управление на коментари.
  3. Легитимация: Вашето съгласие
  4. Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
  5. Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
  6. Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.