ইউনিক: ডুপ্লিকেট টেক্সট খুঁজে পেতে লিনাক্স কমান্ড

কখনও কখনও, এটি সম্ভবত আপনার কাছে খুব দীর্ঘ টেক্সট ফাইল রয়েছে যার মধ্যে নির্দিষ্ট প্যাটার্ন বা খুঁজে পাওয়া কঠিন লাইন বা শব্দ যেগুলো ডুপ্লিকেটেড, অথবা হতে পারে এমন একগুচ্ছ ছোট টেক্সট ফাইল রয়েছে যেখানে আপনি আরও সহজে মিলতে চান, এমনকি একটি পাইপ ব্যবহার করতে এবং একটি কমান্ডের আউটপুট মেলে। যেমন, ইউনিক হল কমান্ড আপনি এটা কি খুঁজছেন.

ইউনিক দিয়ে আপনি পারবেন অপ্রয়োজনীয় তথ্য সন্ধান করুন খুব সহজ উপায়ে। উপরন্তু, এটি আপনাকে সেই সদৃশগুলি অপসারণ করার অনুমতি দেবে যদি আপনার প্রয়োজন হয়। এবং, এই টিউটোরিয়ালে, আপনি কমান্ডের কিছু উদাহরণ দেখতে পাবেন যা আপনার কাজে লাগতে পারে। মনে রাখবেন যে এটি ডিফল্টভাবে বেশিরভাগ ডিস্ট্রোতে ইনস্টল করা আছে, তাই আপনাকে প্যাকেজটি ইনস্টল করতে হবে না...

আচ্ছা, সবার আগে, ইউনিক কমান্ডের মূল বিষয়গুলি এবং এটি কী করে এবং কী করে না তা বোঝার জন্য একটি উদাহরণ দেখি। জন্য উদাহরণস্বরূপ, কল্পনা করুন যে আপনি নামের একটি টেক্সট ফাইল তৈরি করুন test.txt, এবং ভিতরে আপনি বেশ কয়েকটি পুনরাবৃত্তিমূলক বাক্যাংশ বা শব্দ রাখেন, যেমন তিনটি লাইনের পুনরাবৃত্তি «হাই এটি একটি পরীক্ষা» এবং তারপর এটির সাথে ইউনিক ব্যবহার করুন:

nano prueba.txt

uniq prueba.txt

আচ্ছা, সেই ক্ষেত্রে, কমান্ডের আউটপুট সহজভাবে হবে:

Salida:

Hola, esto es una prueba

যে, একটি একক লাইন রাখুন «হাই এটি একটি পরীক্ষা» অন্য 2টি নির্মূল করা যা একই। তবে সাবধান, আপনি যদি আসলটি দেখতে আবার বিড়াল ব্যবহার করেন, আপনি দেখতে পাবেন যে সেগুলি ফাইল থেকে সরানো হয়নি, এটি কেবল তাদের আউটপুট থেকে সরিয়ে দিয়েছে:

cat prueba.txt

যার আউটপুট হবে:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

কিন্তু ইউনিক কমান্ডে আরও অনেক বিকল্প উপলব্ধ রয়েছে। উদাহরণস্বরূপ, এটি আপনাকে বলতে পারে একটি লাইনের পুনরাবৃত্তির সংখ্যা, লাইনের শুরুতে পুনরাবৃত্তির সংখ্যা নির্দেশ করে। এর জন্য:

uniq -c prueba.txt

আপনি শুধু পারেন বারবার লাইন মুদ্রণ করুন, এবং অ-পুনরাবৃত্তি উপেক্ষা করুন:

uniq -d prueba.txt

অথবা যেগুলি -u বিকল্পের সাথে সদৃশ নয়:

uniq -u prueba.txt

ব্যবহার করার জন্য কেস-সংবেদনশীল এবং কেস সংবেদনশীল হতে, আপনি -i বিকল্পটি ব্যবহার করতে পারেন:

uniq -i prueba.txt

ঠিক আছে, এবং কিভাবে এটি করা যেতে পারে শুধুমাত্র অনন্য লাইন দিয়ে একটি ফাইল তৈরি করুন, একযোগে সব সদৃশ নির্মূল. ঠিক আছে, এটি একটি নতুন পাঠ্য ফাইলে ইউনিকের আউটপুট পাইপ করার জন্য একটি পাইপ ব্যবহার করার মতোই সহজ:

uniq prueba.txt > unicas.txt


আপনার মন্তব্য দিন

আপনার ইমেল ঠিকানা প্রকাশিত হবে না। প্রয়োজনীয় ক্ষেত্রগুলি দিয়ে চিহ্নিত করা *

*

*

  1. ডেটার জন্য দায়ী: AB ইন্টারনেট নেটওয়ার্ক 2008 SL
  2. ডেটার উদ্দেশ্য: নিয়ন্ত্রণ স্প্যাম, মন্তব্য পরিচালনা।
  3. আইনীকরণ: আপনার সম্মতি
  4. তথ্য যোগাযোগ: ডেটা আইনি বাধ্যবাধকতা ব্যতীত তৃতীয় পক্ষের কাছে জানানো হবে না।
  5. ডেটা স্টোরেজ: ওসেন্টাস নেটওয়ার্কস (ইইউ) দ্বারা হোস্ট করা ডেটাবেস
  6. অধিকার: যে কোনও সময় আপনি আপনার তথ্য সীমাবদ্ধ করতে, পুনরুদ্ধার করতে এবং মুছতে পারেন।