Datafari: व्यवसायों के लिए एक खुला स्रोत खोज इंजन

लोगो-डेटाफ़ारी

डेटफरी Apache Solr का उपयोग करके ओपन सोर्स एंटरप्राइज सर्च सॉफ्टवेयर है अनुक्रमण और खोज चरणों के लिए। यह Apache ManifoldCF, Apache Solr और Apache Cassandra को जोड़ती है। HTML5, CSS3 और jQuery के आधार पर।

यह इस अर्थ में एक पैकेज्ड सर्च इंजन है डेटा स्रोतों, अनुक्रमण, खोज और चित्रमय प्रणाली प्रशासन से कनेक्शन का प्रस्ताव करता है और SolrCloud का उपयोग करके वितरित किया जाता है।

डेटफरी फ्रांस द्वारा बनाया गया था लैब्स। फ्रांस लैब्स ने एक नए इंट्रानेट प्रासंगिकता एल्गोरिथ्म के साथ अपने आरएंडडी में सुधार के लिए ओपन सोर्स सर्च सॉफ्टवेयर की मांग की।

टीम ने पाया कि अपाचे लाइसेंस के तहत कुछ भी अच्छी तरह से बनाए रखा गया था और उपलब्ध नहीं था और डेटाफ्री बनाया।

वह एल्गोरिथ्म पर अनुसंधान से स्वतंत्र हो गया, यह देखते हुए कि इसका स्वयं का एक खोज मूल्य था।

डेटफरी के बारे में

यह सर्च इंजन कर्मचारियों को डेटा को खोजने में सक्षम बनाता है, जहां भी वह सुरक्षित और सुरक्षित है.

अधिक विशेष रूप से, Datafari विभिन्न स्रोतों और फ़ाइल स्वरूपों से डेटा और दस्तावेज़ों को पुनर्प्राप्त और अनुक्रमित करता है, और आंतरिक दस्तावेज़ और मेटाडेटा दोनों की खोज करने की अनुमति देता है।

इसके अलावा, औरयह एक खुले स्रोत संस्करण में उपलब्ध है, जिसे डेटाफ़री कम्युनिटी एडिशन कहा जाता है, और एक मालिकाना संस्करण में, डेटाफ़ारी एंटरप्राइज संस्करण कहा जाता है।

जैसा कि ऊपर उल्लेख किया गया है, यह व्यवसाय के लिए एक खोज इंजन है।

आपके लक्ष्य एक वेब खोज इंजन से अलग हैं, और तकनीकी चुनौतियां अलग हैं।

व्यावसायिक खोज इंजन के लिए, यह बहु-स्रोत, बहु-प्रारूप और सुरक्षा प्रबंधन करना चाहिए।

इसके अलावा, आपको अपने आप को टूल प्रबंधित करने की अनुमति देनी होगी। नि: शुल्क संस्करण में, हम प्रशासन की ओर से कर सकते हैं:

  • बूलियन ऑपरेटरों सहित पाठ खोज
  • Apache ManifoldCF आधारित क्रॉलर जो CMS, वेबसाइटों, साझा की गई फ़ाइलों (Netapp, Samba, Windows), ईमेल, डेटाबेस, HDFS को अनुक्रमित करने की अनुमति देता है।
  • अनुक्रमण और खोज चरणों में ट्रांसफ़ॉर्म फ़िल्टर जोड़ने के लिए "पूर्ण-पाठ" एनालिटिक्स और एक प्लग-इन सिस्टम
  • एचटीएमएल 5 और जावास्क्रिप्ट में ग्राफ़िकल इंटरफ़ेस जो उत्तरदायी डिजाइन में एचटीएमएल विजेट का उपयोग करता है
  • विभिन्न प्रकार के दस्तावेजों (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3 ...) से सामग्री और मेटाडाटा का विश्लेषण और निकालने के लिए Apache Tika का उपयोग।
  • निष्कर्षण मोड के बजाय इंसर्ट मोड (सूचना रिसेप्शन) में नए परिणामों की सूचनाएँ प्राप्त करने के लिए ई-मेल अलर्ट सिस्टम।

datafari- खोज-समर्थन

खोज इंजन प्रशासकों के लिए

  • उपयोगकर्ता खोज क्वेरी ग्राफिकल विश्लेषण उपकरण।
  • Datafari में प्रयुक्त सोलर प्रशासन उपकरण।
  • पैदावार का विश्लेषण करने और प्रश्नों की प्रासंगिकता की गणना करने के लिए उपकरण।
  • विज्ञापन या LDAP के साथ सुरक्षा के लिए प्रशासन उपकरण।
  • समानार्थी शब्द का प्रबंधन करने के लिए उपकरण।
  • प्रोमोलिंक को प्रबंधित करने के लिए उपकरण, अनुमति देता है कि पहचान किए गए कीवर्ड के लिए प्रदर्शित होने वाले डेटा में नहीं है।
  • कई वाणिज्यिक डेटा स्रोतों (शेयरपॉइंट, साझा की गई फ़ाइलें, ईमेल, वेबसाइट, CMIS ...) और नए लोगों को बनाने की क्षमता के साथ ट्रैकिंग कनेक्टर को प्रबंधित करने का उपकरण।

कैसे पाएं डाटाफ्री?

जो लोग इस खोज इंजन को प्राप्त करने में रुचि रखते हैं, वे इसके बारे में थोड़ा और जानने के लिए और यह जानने के लिए कि क्या वे इसे अपने व्यवसायों या कंपनियों में लागू कर सकते हैं, उन्हें निम्नलिखित चरणों का पालन करना चाहिए।

डेटफरी हम इसे एक वर्चुअल मशीन या एक डॉकेबल कंटेनर के माध्यम से ढूंढ सकते हैं या आप डेबियन या रेडहैट के लिए इंस्टॉलेशन डाउनलोड कर सकते हैं (RHEL केवल डेटाफरी एंटरप्राइज एडिशन के साथ उपलब्ध है)।

पैरा जो डेबियन, उबंटू या व्युत्पन्न सिस्टम के उपयोगकर्ता हैं वे डेवलपर्स द्वारा परियोजना की आधिकारिक वेबसाइट से प्रदान किए गए डिब पैकेज का उपयोग कर सकते हैं।

उन्हें एक टर्मिनल खोलना होगा और निम्नलिखित कमांड को निष्पादित करना होगा:

wget https://www.datafari.com/files/debian/datafari.deb

एक बार डाउनलोड हो जाने के बाद, हम पैकेज को इनस्टॉल करने के लिए आगे बढ़ते हैं:

sudo dpkg -i datafari.deb

पैरा अन्य सभी लिनक्स वितरण डॉकटर कंटेनरों की मदद से अपने सिस्टम पर इंस्टॉलेशन प्राप्त कर सकते हैं इसलिए इसकी स्थापना के लिए उनके पास इसका समर्थन होना चाहिए और निम्नलिखित कमांड के साथ स्थापित होना चाहिए:

docker pull datafari/datafari

अभी शुरू करने के लिए, यह शायद सबसे अच्छा है त्वरित आरंभ गाइड का पालन करें।


अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: एबी इंटरनेट नेटवर्क 2008 SL
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।