uniq:重複するテキストを検索するLinuxコマンド

場合によっては、非常に長いテキストファイルがあり、その中から特定のパターンを見つけることが難しい場合があります。 重複する行または単語、または、より簡単に照合したい、さらにはパイプを使用してコマンドの出力を照合したい小さなテキストファイルがたくさんあるかもしれません。 同様に、 uniqはコマンドです 何を探していますか。

uniqを使用すると、次のことができます 冗長な情報を探す 非常に簡単な方法で。 さらに、必要に応じてこれらの重複を削除することもできます。 また、このチュートリアルでは、役立つと思われるコマンドの例をいくつか紹介します。 ほとんどのディストリビューションにデフォルトでインストールされているため、パッケージをインストールする必要はありません...

まず、uniqコマンドの基本と、それが何をするのか、何をしないのかを理解するための例を見てみましょう。 にとって ejemplo、というテキストファイルを作成するとします。 test.txt、そして中には、XNUMX行を繰り返すなど、いくつかの繰り返されるフレーズや単語を入れます«こんにちはこれはテストです»次に、uniqを使用します。

nano prueba.txt

uniq prueba.txt

ええと、その場合、 コマンドの出力 単純になります:

Salida:

Hola, esto es una prueba

つまり、XNUMX行で«こんにちはこれはテストです»同じである他の2つを削除します。 ただし、catを再度使用して元のファイルを表示すると、ファイルから削除されていないことがわかります。出力から削除されているだけです。

cat prueba.txt

その出力は次のようになります。

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

ただし、uniqコマンドにはさらに多くのオプションがあります。 たとえば、それはあなたに言うことができます 行が繰り返される回数、行の先頭に繰り返し回数を示します。 それのための:

uniq -c prueba.txt

あなたも 繰り返し行を印刷する、および繰り返されないものを無視します。

uniq -d prueba.txt

または、-uオプションで複製されていないもの:

uniq -u prueba.txt

使用する ケースセンシティブ 大文字と小文字を区別する場合は、-iオプションを使用できます。

uniq -i prueba.txt

わかりました、そしてそれはどのように行うことができますか 一意の行のみでファイルを作成する、すべての重複を一度に削除します。 パイプを使用してuniqの出力を新しいテキストファイルにパイプするのと同じくらい簡単です。

uniq prueba.txt > unicas.txt


コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:AB Internet Networks 2008 SL
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。