uniq : commande Linux pour rechercher du texte en double

Parfois, il est probable que vous ayez des fichiers texte très longs parmi lesquels il est difficile de retrouver certains motifs ou lignes ou mots qui sont dupliqués, ou peut-être existe-t-il un tas de petits fichiers texte dans lesquels vous souhaitez faire correspondre plus facilement, et même utiliser un tube et faire correspondre la sortie d'une commande. Aussi, uniq est la commande qu'est-ce que tu cherches.

Avec uniq, vous pouvez rechercher des informations redondantes d'une manière très simple. De plus, cela vous permettra également de supprimer ces doublons si vous en avez besoin. Et, dans ce didacticiel, vous verrez quelques exemples de la commande qui pourraient vous être utiles. N'oubliez pas qu'il est installé par défaut dans la grande majorité des distributions, vous n'aurez donc pas à installer le package...

Eh bien, tout d'abord, voyons un exemple pour comprendre les bases de la commande uniq et ce qu'elle fait et ce qu'elle ne fait pas. Pour exemple, imaginez que vous créez un fichier texte nommé test.txt, et à l'intérieur vous mettez plusieurs phrases ou mots répétés, comme répéter trois lignes «salut c'est un test» puis utilisez uniq avec :

nano prueba.txt

uniq prueba.txt

Eh bien, dans ce cas, la sortie de la commande sera simplement :

Salida:

Hola, esto es una prueba

C'est-à-dire mettre une seule ligne «salut c'est un test» en éliminant les 2 autres qui sont identiques. Mais attention, si vous utilisez à nouveau cat pour voir l'original, vous verrez qu'ils n'ont pas été supprimés du fichier, il les a simplement supprimés de la sortie :

cat prueba.txt

dont la sortie serait :

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Mais la commande uniq a beaucoup plus d'options disponibles. Par exemple, il peut vous dire le nombre de fois qu'une ligne est répétée, indiquant en début de ligne le nombre de répétitions. Pour cela:

uniq -c prueba.txt

Vous pourriez aussi simplement imprimer les lignes répétées, et ignorez celles qui ne se répètent pas :

uniq -d prueba.txt

Ou ceux qui ne sont pas dupliqués avec l'option -u :

uniq -u prueba.txt

Pour utiliser sensible à la casse et soyez sensible à la casse, vous pouvez utiliser l'option -i :

uniq -i prueba.txt

Ok, et comment pourrait-il être fait pour créer un fichier avec uniquement les lignes uniques, éliminant tous les doublons à la fois. Eh bien, c'est aussi simple que d'utiliser un tube pour diriger la sortie de uniq vers un nouveau fichier texte :

uniq prueba.txt > unicas.txt


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

*

*

  1. Responsable des données : AB Internet Networks 2008 SL
  2. Finalité des données: Contrôle du SPAM, gestion des commentaires.
  3. Légitimation: votre consentement
  4. Communication des données: Les données ne seront pas communiquées à des tiers sauf obligation légale.
  5. Stockage des données: base de données hébergée par Occentus Networks (EU)
  6. Droits: à tout moment, vous pouvez limiter, récupérer et supprimer vos informations.