uniq: डुप्लिकेट टेक्स्ट खोजने के लिए लिनक्स कमांड

कभी-कभी, यह संभावना होती है कि आपके पास बहुत लंबी टेक्स्ट फ़ाइलें हों, जिनमें से कुछ पैटर्न ढूंढना मुश्किल हो या पंक्तियाँ या शब्द जो दोहराए गए हैं, या हो सकता है कि छोटी टेक्स्ट फ़ाइलों का एक समूह हो जहां आप अधिक आसानी से मिलान करना चाहते हैं, और यहां तक ​​कि एक पाइप का उपयोग करें और एक कमांड के आउटपुट से मिलान करें। भी, uniq कमांड है आप इसे क्या ढूंढ रहे हैं।

uniq के साथ आप कर सकते हैं अनावश्यक जानकारी की तलाश करें बहुत ही सरल तरीके से। इसके अलावा, यह आपको जरूरत पड़ने पर उन डुप्लिकेट को हटाने की भी अनुमति देगा। और, इस ट्यूटोरियल में, आप कमांड के कुछ उदाहरण देखेंगे जो आपको उपयोगी लग सकते हैं। याद रखें कि यह डिस्ट्रो के विशाल बहुमत में डिफ़ॉल्ट रूप से स्थापित है, इसलिए आपको पैकेज को स्थापित करने की आवश्यकता नहीं होगी...

खैर, सबसे पहले, आइए uniq कमांड की मूल बातें समझने के लिए एक उदाहरण देखें और यह क्या करता है और क्या नहीं करता है। के लिये ejemplo, कल्पना करें कि आप एक टेक्स्ट फ़ाइल बनाते हैं जिसे कहा जाता है परीक्षण, और आपके अंदर कई दोहराए गए वाक्यांश या शब्द हैं, जैसे तीन पंक्तियों को दोहराना «नमस्ते यह एक परीक्षा है» और फिर इसके साथ uniq का उपयोग करें:

nano prueba.txt

uniq prueba.txt

वैसे उस मामले में, कमांड का आउटपुट सरल होगा:

Salida:

Hola, esto es una prueba

यानी एक ही लाइन लगाएं «नमस्ते यह एक परीक्षा है» अन्य 2 को समाप्त करना जो समान हैं। लेकिन सावधान रहें, यदि आप मूल को देखने के लिए फिर से बिल्ली का उपयोग करते हैं, तो आप देखेंगे कि उन्हें फ़ाइल से नहीं हटाया गया है, इसने उन्हें केवल आउटपुट से हटा दिया है:

cat prueba.txt

जिसका आउटपुट होगा:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

लेकिन uniq कमांड के पास और भी कई विकल्प उपलब्ध हैं। उदाहरण के लिए, यह आपको बता सकता है एक पंक्ति को जितनी बार दोहराया जाता है, पंक्ति की शुरुआत में दोहराव की संख्या को दर्शाता है। इसके लिए:

uniq -c prueba.txt

आप भी कर सकते हैं दोहराई गई पंक्तियों को प्रिंट करें, और गैर-दोहराए गए लोगों को अनदेखा करें:

uniq -d prueba.txt

या जिन्हें -u विकल्प के साथ डुप्लीकेट नहीं किया गया है:

uniq -u prueba.txt

उपयोग करने के लिए केस-संवेदी और केस संवेदी हो, आप -i विकल्प का उपयोग कर सकते हैं:

uniq -i prueba.txt

ठीक है, और यह कैसे किया जा सकता है केवल अनूठी पंक्तियों वाली फ़ाइल बनाएँ, एक ही बार में सभी डुप्लिकेट को समाप्त करना। खैर, यह एक नई टेक्स्ट फ़ाइल में uniq के आउटपुट को पाइप करने के लिए पाइप का उपयोग करने जितना आसान है:

uniq prueba.txt > unicas.txt


अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: एबी इंटरनेट नेटवर्क 2008 SL
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।