uniq: डुप्लिकेट मजकूर शोधण्यासाठी लिनक्स कमांड

काहीवेळा, तुमच्याकडे खूप लांब मजकूर फाइल्स असण्याची शक्यता असते ज्यामध्ये विशिष्ट नमुने शोधणे कठीण असते किंवा डुप्लिकेट केलेल्या ओळी किंवा शब्द, किंवा कदाचित लहान मजकूर फाइल्सचा एक समूह आहे जिथे तुम्हाला अधिक सहजपणे जुळवायचे आहे, आणि अगदी पाईप वापरून कमांडचे आउटपुट जुळवायचे आहे. सुद्धा, uniq ही आज्ञा आहे तुम्ही ते काय शोधत आहात.

Uniq सह तुम्ही करू शकता अनावश्यक माहिती पहा अगदी सोप्या पद्धतीने. याव्यतिरिक्त, आपल्याला आवश्यक असल्यास ते डुप्लिकेट काढण्याची परवानगी देखील देईल. आणि, या ट्युटोरियलमध्ये, तुम्हाला कमांडची काही उदाहरणे दिसतील जी तुम्हाला उपयोगी पडतील. लक्षात ठेवा की ते बहुसंख्य डिस्ट्रोमध्ये डीफॉल्टनुसार स्थापित केले आहे, त्यामुळे तुम्हाला पॅकेज स्थापित करावे लागणार नाही...

बरं, सर्वप्रथम, युनिक कमांडची मूलभूत माहिती समजून घेण्यासाठी एक उदाहरण पाहू आणि ते काय करते आणि काय करत नाही. च्या साठी इमेम्प्लो, कल्पना करा की तुम्ही नावाची मजकूर फाइल तयार केली आहे test.txt, आणि आत तुम्ही अनेक पुनरावृत्ती वाक्ये किंवा शब्द ठेवता, जसे की तीन ओळींची पुनरावृत्ती करणे «नमस्कार ही एक चाचणी आहे» आणि नंतर त्यासह युनिक वापरा:

nano prueba.txt

uniq prueba.txt

बरं, त्या बाबतीत, कमांडचे आउटपुट सोपे होईल:

Salida:

Hola, esto es una prueba

म्हणजे, एकच ओळ लावा «नमस्कार ही एक चाचणी आहे» इतर 2 समान आहेत ते काढून टाकणे. परंतु सावध रहा, जर तुम्ही मूळ पाहण्यासाठी मांजर पुन्हा वापरत असाल, तर तुम्हाला दिसेल की ते फाइलमधून काढले गेले नाहीत, ते फक्त आउटपुटमधून काढून टाकले आहे:

cat prueba.txt

ज्याचे आउटपुट असेल:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

पण युनिक कमांडमध्ये आणखी बरेच पर्याय उपलब्ध आहेत. उदाहरणार्थ, ते तुम्हाला सांगू शकते ओळ किती वेळा पुनरावृत्ती होते, ओळीच्या सुरूवातीस पुनरावृत्तीची संख्या दर्शवित आहे. त्यासाठी:

uniq -c prueba.txt

आपण देखील करू शकता फक्त वारंवार ओळी मुद्रित करा, आणि पुनरावृत्ती न होणाऱ्यांकडे दुर्लक्ष करा:

uniq -d prueba.txt

किंवा जे -u पर्यायासह डुप्लिकेट केलेले नाहीत:

uniq -u prueba.txt

वापरण्यासाठी केस-संवेदी आणि केस सेन्सेटिव्ह, तुम्ही -i पर्याय वापरू शकता:

uniq -i prueba.txt

ठीक आहे, आणि ते कसे केले जाऊ शकते फक्त अनन्य रेषांसह फाइल तयार करा, एकाच वेळी सर्व डुप्लिकेट काढून टाकणे. बरं, नवीन मजकूर फाईलमध्ये युनिकचे आउटपुट पाइप करण्यासाठी पाईप वापरण्याइतके सोपे आहे:

uniq prueba.txt > unicas.txt


आपली टिप्पणी द्या

आपला ई-मेल पत्ता प्रकाशित केला जाणार नाही. आवश्यक फील्ड चिन्हांकित केले आहेत *

*

*

  1. डेटासाठी जबाबदार: AB इंटरनेट नेटवर्क 2008 SL
  2. डेटाचा उद्देशः नियंत्रण स्पॅम, टिप्पणी व्यवस्थापन.
  3. कायदे: आपली संमती
  4. डेटा संप्रेषण: कायदेशीर बंधन वगळता डेटा तृतीय पक्षास कळविला जाणार नाही.
  5. डेटा संग्रहण: ओकेन्टस नेटवर्क (EU) द्वारा होस्ट केलेला डेटाबेस
  6. अधिकारः कोणत्याही वेळी आपण आपली माहिती मर्यादित, पुनर्प्राप्त आणि हटवू शकता.