uniq: команда Linux для пошуку повторюваного тексту

Іноді, ймовірно, у вас є дуже довгі текстові файли, серед яких важко знайти певні шаблони або рядки або слова, які дублюються, або, можливо, є купа невеликих текстових файлів, у яких ви хочете легше знайти відповідність, і навіть використовувати трубу та узгоджувати вихід команди. Так само, uniq - це команда що ти шукаєш.

З uniq можна шукати зайву інформацію дуже простим способом. Крім того, це також дозволить вам видалити ці дублікати, якщо вам потрібно. І в цьому підручнику ви побачите кілька прикладів команди, які можуть бути вам корисними. Пам'ятайте, що він встановлюється за замовчуванням у переважній більшості дистрибутивів, тому вам не доведеться встановлювати пакет...

Ну, перш за все, давайте подивимося на приклад, щоб зрозуміти основи команди uniq і що вона робить, а що ні. Для приклад, уявіть, що ви створюєте текстовий файл під назвою test.txt, а всередині ви помістіть кілька повторюваних фраз або слів, наприклад повторення трьох рядків «Привіт, це тест» а потім використовуйте з ним uniq:

nano prueba.txt

uniq prueba.txt

Ну, в такому випадку, вихід команди буде просто:

Salida:

Hola, esto es una prueba

Тобто поставте один рядок «Привіт, це тест» вилучивши інші 2 однакові. Але будьте обережні, якщо ви знову скористаєтеся cat для перегляду оригіналу, ви побачите, що вони не були видалені з файлу, він просто видалив їх із виводу:

cat prueba.txt

чий вихід буде:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Але команда uniq має набагато більше доступних опцій. Наприклад, це може розповісти вам кількість разів повторення рядка, що вказує на початку рядка кількість повторень. Для нього:

uniq -c prueba.txt

Ви також могли просто друкувати повторювані рядки, і ігноруйте неповторні:

uniq -d prueba.txt

Або ті, які не дублюються за допомогою параметра -u:

uniq -u prueba.txt

Використовувати з урахуванням регістру і враховуючи регістр, ви можете використовувати параметр -i:

uniq -i prueba.txt

Добре, і як це можна зробити створити файл лише з унікальними рядками, видаляючи всі дублікати відразу. Ну, це так само просто, як використовувати трубу для передачі виводу uniq до нового текстового файлу:

uniq prueba.txt > unicas.txt


Залиште свій коментар

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

*

*

  1. Відповідальний за дані: AB Internet Networks 2008 SL
  2. Призначення даних: Контроль спаму, управління коментарями.
  3. Легітимація: Ваша згода
  4. Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
  5. Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
  6. Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.