uniq: lệnh Linux để tìm văn bản trùng lặp

Đôi khi, rất có thể bạn có các tệp văn bản rất dài trong đó khó tìm thấy các mẫu nhất định hoặc dòng hoặc từ được sao chéphoặc có thể có một loạt các tệp văn bản nhỏ mà bạn muốn khớp dễ dàng hơn và thậm chí sử dụng đường dẫn và khớp với đầu ra của một lệnh. Cũng, uniq là lệnh bạn đang tìm kiếm nó

Với uniq bạn có thể tìm kiếm thông tin thừa một cách rất đơn giản. Ngoài ra, nó cũng sẽ cho phép bạn xóa các bản sao đó nếu bạn cần. Và, trong hướng dẫn này, bạn sẽ thấy một số ví dụ về lệnh mà bạn có thể thấy hữu ích. Hãy nhớ rằng nó được cài đặt theo mặc định trong phần lớn các bản phân phối, vì vậy bạn sẽ không phải cài đặt gói ...

Trước hết, chúng ta hãy xem một ví dụ để hiểu những điều cơ bản về lệnh uniq và những gì nó làm và những gì nó không làm. Vì ejemplo, hãy tưởng tượng rằng bạn tạo một tệp văn bản có tên test.txtvà bên trong bạn đặt một số cụm từ hoặc từ được lặp lại, chẳng hạn như lặp lại ba dòng «Xin chào, đây là một bài kiểm tra»Và sau đó sử dụng uniq với nó:

nano prueba.txt

uniq prueba.txt

Tốt trong trường hợp đó, đầu ra của lệnh sẽ đơn giản là:

Salida:

Hola, esto es una prueba

Đó là, đặt một dòng duy nhất «Xin chào, đây là một bài kiểm tra»Loại bỏ 2 cái khác giống nhau. Nhưng hãy cẩn thận, nếu bạn sử dụng cat một lần nữa để xem bản gốc, bạn sẽ thấy rằng chúng chưa bị xóa khỏi tệp, nó chỉ đơn giản là xóa chúng khỏi đầu ra:

cat prueba.txt

đầu ra của ai sẽ là:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Nhưng lệnh uniq có nhiều tùy chọn hơn. Ví dụ, nó có thể cho bạn biết số lần một dòng được lặp lại, cho biết ở đầu dòng số lần lặp lại. Cho nó:

uniq -c prueba.txt

Bạn cũng có thể chỉ in các dòng lặp lạivà bỏ qua những cái không lặp lại:

uniq -d prueba.txt

Hoặc những cái không bị trùng lặp với tùy chọn -u:

uniq -u prueba.txt

sử dụng phân biệt chữ hoa chữ thường và phân biệt chữ hoa chữ thường, bạn có thể sử dụng tùy chọn -i:

uniq -i prueba.txt

Ok, và nó có thể được thực hiện như thế nào để tạo một tệp chỉ có các dòng duy nhất, loại bỏ tất cả các bản sao cùng một lúc. Vâng, nó đơn giản như sử dụng một đường ống để chuyển đầu ra của uniq sang một tệp văn bản mới:

uniq prueba.txt > unicas.txt


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: AB Internet Networks 2008 SL
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.