uniq: Perintah Linux untuk menemukan teks duplikat

Terkadang, kemungkinan Anda memiliki file teks yang sangat panjang di antaranya sulit untuk menemukan pola tertentu atau baris atau kata-kata yang digandakan, atau mungkin ada banyak file teks kecil yang ingin Anda cocokkan dengan lebih mudah, dan bahkan menggunakan pipa dan mencocokkan output dari suatu perintah. Demikian juga, uniq adalah perintahnya apa yang kamu cari itu.

Dengan uniq kamu bisa mencari informasi yang berlebihan dengan cara yang sangat sederhana. Selain itu, Anda juga dapat menghapus duplikat tersebut jika perlu. Dan, dalam tutorial ini, Anda akan melihat beberapa contoh perintah yang mungkin berguna bagi Anda. Ingat bahwa itu diinstal secara default di sebagian besar distro, jadi Anda tidak perlu menginstal paket...

Baiklah, pertama-tama, mari kita lihat contoh untuk memahami dasar-dasar perintah uniq dan apa yang dilakukannya dan apa yang tidak. Untuk ejemplo, bayangkan Anda membuat file teks bernama test.txt, dan di dalamnya Anda memasukkan beberapa frasa atau kata yang diulang, seperti mengulangi tiga baris «Hai ini ujian» dan kemudian gunakan uniq dengannya:

nano prueba.txt

uniq prueba.txt

Nah, dalam hal itu, keluaran dari perintah akan sederhana:

Salida:

Hola, esto es una prueba

Artinya, letakkan satu baris «Hai ini ujian» menghilangkan 2 lainnya yang sama. Namun berhati-hatilah, jika Anda menggunakan cat lagi untuk melihat aslinya, Anda akan melihat bahwa mereka belum dihapus dari file, itu hanya menghapusnya dari output:

cat prueba.txt

yang outputnya menjadi:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Tetapi perintah uniq memiliki lebih banyak opsi yang tersedia. Misalnya, itu dapat memberi tahu Anda berapa kali garis diulang, menunjukkan di awal baris jumlah pengulangan. Untuk itu:

uniq -c prueba.txt

Anda juga bisa cetak garis berulang, dan abaikan yang tidak berulang:

uniq -d prueba.txt

Atau yang tidak diduplikasi dengan opsi -u:

uniq -u prueba.txt

Untuk digunakan peka huruf besar/kecil dan peka terhadap huruf besar/kecil, Anda dapat menggunakan opsi -i:

uniq -i prueba.txt

Oke, dan bagaimana itu bisa dilakukan untuk buat file hanya dengan baris unik, menghilangkan semua duplikat sekaligus. Sesederhana menggunakan pipa untuk menyalurkan output uniq ke file teks baru:

uniq prueba.txt > unicas.txt


tinggalkan Komentar Anda

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

*

*

  1. Bertanggung jawab atas data: AB Internet Networks 2008 SL
  2. Tujuan data: Mengontrol SPAM, manajemen komentar.
  3. Legitimasi: Persetujuan Anda
  4. Komunikasi data: Data tidak akan dikomunikasikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Basis data dihosting oleh Occentus Networks (UE)
  6. Hak: Anda dapat membatasi, memulihkan, dan menghapus informasi Anda kapan saja.