uniq: ડુપ્લિકેટ ટેક્સ્ટ શોધવા માટે Linux આદેશ

કેટલીકવાર, સંભવ છે કે તમારી પાસે ખૂબ જ લાંબી ટેક્સ્ટ ફાઇલો છે જેમાંથી ચોક્કસ પેટર્ન શોધવાનું મુશ્કેલ છે અથવા લીટીઓ અથવા શબ્દો કે જે ડુપ્લિકેટ છે, અથવા કદાચ ત્યાં નાની ટેક્સ્ટ ફાઇલોનો સમૂહ છે જ્યાં તમે વધુ સરળતાથી મેચ કરવા માંગો છો, અને તે પણ પાઇપનો ઉપયોગ કરો અને આદેશના આઉટપુટને મેચ કરો. તેમજ, યુનિક એ આદેશ છે તમે તેને શું શોધી રહ્યા છો.

યુનિક સાથે તમે કરી શકો છો બિનજરૂરી માહિતી માટે જુઓ ખૂબ જ સરળ રીતે. વધુમાં, જો તમને જરૂર હોય તો તે તમને તે ડુપ્લિકેટ્સ દૂર કરવાની પણ પરવાનગી આપશે. અને, આ ટ્યુટોરીયલમાં, તમે આદેશના કેટલાક ઉદાહરણો જોશો જે તમને ઉપયોગી લાગશે. યાદ રાખો કે તે મોટાભાગના ડિસ્ટ્રોસમાં ડિફોલ્ટ રૂપે ઇન્સ્ટોલ કરેલું છે, તેથી તમારે પેકેજ ઇન્સ્ટોલ કરવું પડશે નહીં...

સારું, સૌ પ્રથમ, ચાલો યુનિક કમાન્ડની મૂળભૂત બાબતોને સમજવા માટે એક ઉદાહરણ જોઈએ અને તે શું કરે છે અને શું નથી કરતું. માટે ઇઝેમ્પ્લો, કલ્પના કરો કે તમે નામની ટેક્સ્ટ ફાઇલ બનાવો છો test.txt, અને અંદર તમે ઘણા પુનરાવર્તિત શબ્દસમૂહો અથવા શબ્દો મૂકો છો, જેમ કે ત્રણ લીટીઓનું પુનરાવર્તન «હાય આ એક ટેસ્ટ છે» અને પછી તેની સાથે યુનિકનો ઉપયોગ કરો:

nano prueba.txt

uniq prueba.txt

સારું, તે કિસ્સામાં, આદેશનું આઉટપુટ સરળ હશે:

Salida:

Hola, esto es una prueba

એટલે કે, એક લીટી મૂકો «હાય આ એક ટેસ્ટ છે» અન્ય 2 જે સમાન છે તેને દૂર કરવું. પરંતુ સાવચેત રહો, જો તમે મૂળ જોવા માટે ફરીથી બિલાડીનો ઉપયોગ કરો છો, તો તમે જોશો કે તે ફાઇલમાંથી દૂર કરવામાં આવી નથી, તેને ફક્ત આઉટપુટમાંથી દૂર કરવામાં આવી છે:

cat prueba.txt

જેનું આઉટપુટ હશે:

Hola, esto es una prueba

Hola, esto es una prueba

Hola, esto es una prueba

પરંતુ યુનિક કમાન્ડ પાસે ઘણા વધુ વિકલ્પો ઉપલબ્ધ છે. ઉદાહરણ તરીકે, તે તમને કહી શકે છે એક લીટી કેટલી વખત પુનરાવર્તિત થાય છે, લાઇનની શરૂઆતમાં પુનરાવર્તનોની સંખ્યા દર્શાવે છે. તે માટે:

uniq -c prueba.txt

તમે પણ માત્ર કરી શકે છે પુનરાવર્તિત રેખાઓ છાપો, અને પુનરાવર્તિત ન હોય તેને અવગણો:

uniq -d prueba.txt

અથવા જે -u વિકલ્પ સાથે ડુપ્લિકેટ નથી:

uniq -u prueba.txt

વાપરવા માટે કેસ-સંવેદી અને કેસ સંવેદનશીલ હોય, તો તમે -i વિકલ્પનો ઉપયોગ કરી શકો છો:

uniq -i prueba.txt

ઠીક છે, અને તે કેવી રીતે કરી શકાય છે ફક્ત અનન્ય રેખાઓ સાથે ફાઇલ બનાવો, એક જ સમયે તમામ ડુપ્લિકેટ્સ દૂર કરી રહ્યા છીએ. સારું, તે નવી ટેક્સ્ટ ફાઇલમાં યુનિકના આઉટપુટને પાઇપ કરવા માટે પાઇપનો ઉપયોગ કરવા જેટલું સરળ છે:

uniq prueba.txt > unicas.txt


તમારી ટિપ્પણી મૂકો

તમારું ઇમેઇલ સરનામું પ્રકાશિત કરવામાં આવશે નહીં. આવશ્યક ક્ષેત્રો સાથે ચિહ્નિત થયેલ છે *

*

*

  1. ડેટા માટે જવાબદાર: AB ઈન્ટરનેટ નેટવર્ક્સ 2008 SL
  2. ડેટાનો હેતુ: નિયંત્રણ સ્પામ, ટિપ્પણી સંચાલન.
  3. કાયદો: તમારી સંમતિ
  4. ડેટાની વાતચીત: કાયદાકીય જવાબદારી સિવાય ડેટા તૃતીય પક્ષને આપવામાં આવશે નહીં.
  5. ડેટા સ્ટોરેજ: cસેન્ટસ નેટવર્ક્સ (ઇયુ) દ્વારા હોસ્ટ કરેલો ડેટાબેઝ
  6. અધિકાર: કોઈપણ સમયે તમે તમારી માહિતીને મર્યાદિત, પુન recoverપ્રાપ્ત અને કા deleteી શકો છો.