unikalus: „Linux“ komanda, skirta rasti pasikartojantį tekstą

Kartais tikėtina, kad turite labai ilgus tekstinius failus, tarp kurių sunku rasti tam tikrus šablonus arba eilučių ar žodžių, kurie pasikartoja, o gal yra daugybė mažų tekstinių failų, kuriuos norite lengviau suderinti ir netgi naudoti vamzdį ir suderinti komandos išvestį. Taip pat, uniq yra komanda ko tu to ieškai.

Su unikaliu galite ieškoti perteklinės informacijos labai paprastu būdu. Be to, prireikus galėsite pašalinti tuos dublikatus. Ir šioje pamokoje pamatysite keletą komandos pavyzdžių, kurie jums gali būti naudingi. Atminkite, kad jis pagal numatytuosius nustatymus yra įdiegtas daugumoje platinimo įrenginių, todėl jums nereikės įdiegti paketo...

Na, pirmiausia pažiūrėkime pavyzdį, kad suprastume „uniq“ komandos pagrindus ir ką ji daro ir ko ne. Dėl ejemplo, įsivaizduokite, kad sukuriate tekstinį failą, vadinamą test.txt, o viduje įdedate keletą pasikartojančių frazių ar žodžių, pavyzdžiui, pakartokite tris eilutes «Sveiki, tai testas» ir tada su juo naudokite uniq:

nano prueba.txt

uniq prueba.txt

Na, tokiu atveju komandos išvestis bus tiesiog:

Salida:

Hola, esto es una prueba

Tai yra, įdėkite vieną eilutę «Sveiki, tai testas» pašalinant kitus 2 tokius pačius. Tačiau saugokitės, jei dar kartą naudosite cat, kad pamatytumėte originalą, pamatysite, kad jie nebuvo pašalinti iš failo, jis tiesiog pašalino juos iš išvesties:

cat prueba.txt

kurio išvestis būtų:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

Tačiau komanda „uniq“ turi daug daugiau parinkčių. Pavyzdžiui, jis gali jums pasakyti eilutės kartojimosi skaičius, eilutės pradžioje nurodant pakartojimų skaičių. Už jį:

uniq -c prueba.txt

Taip pat galėtumėte tiesiog spausdinti pasikartojančias eilutesir nepaisykite nesikartojančių:

uniq -d prueba.txt

Arba tie, kurie nėra dubliuojami naudojant -u parinktį:

uniq -u prueba.txt

Naudoti didžiosios ir mažosios raidės ir naudokite didžiąsias ir mažąsias raides, galite naudoti parinktį -i:

uniq -i prueba.txt

Gerai, ir kaip tai būtų galima padaryti sukurti failą tik su unikaliomis eilutėmis, pašalinant visus dublikatus vienu metu. Na, tai taip paprasta, kaip naudojant vamzdį, kad uniq išvestis būtų nukreipta į naują tekstinį failą:

uniq prueba.txt > unicas.txt


Palikite komentarą

Jūsų elektroninio pašto adresas nebus skelbiamas. Privalomi laukai yra pažymėti *

*

*

  1. Už duomenis atsakingas: AB Internet Networks 2008 SL
  2. Duomenų paskirtis: kontroliuoti šlamštą, komentarų valdymą.
  3. Įteisinimas: jūsų sutikimas
  4. Duomenų perdavimas: Duomenys nebus perduoti trečiosioms šalims, išskyrus teisinius įsipareigojimus.
  5. Duomenų saugojimas: „Occentus Networks“ (ES) talpinama duomenų bazė
  6. Teisės: bet kuriuo metu galite apriboti, atkurti ir ištrinti savo informaciją.