Datafari: un motor de căutare open source pentru companii

logo-datafari

Datafarian este un software open source de căutare pentru întreprinderi care utilizează Apache Solr pentru fazele de indexare și căutare. Acesta combină Apache ManifoldCF, Apache Solr și Apache Cassandra. bazat pe HTML5, CSS3 și jQuery.

Acesta este un motor de căutare ambalat în sensul că propune conectarea la surse de date, indexare, căutare și administrare grafică a sistemului și este distribuit utilizând SolrCloud.

Datafarian a fost creat de Franța France Labs a căutat un software de căutare open source pentru a-și îmbunătăți cercetarea și dezvoltarea cu un nou algoritm de relevanță intranet.

Echipa a descoperit că nu există nimic bine întreținut și disponibil sub o licență Apache și a creat Datafari.

El a devenit independent de cercetările asupra algoritmului, considerând că acesta avea o valoare de căutare proprie.

Despre Datafari

Acest motor de căutare permite angajaților să găsească date oriunde s-ar afla, în siguranță și în siguranță.

Mai precis, Datafari preia și indexează date și documente din diferite surse și formate de fișiere și permite căutarea atât a documentelor interne, cât și a metadatelor.

În plus, șiEste disponibil într-o versiune open source, numită Datafari Community Edition, și într-o versiune proprietară, numită Datafari Enterprise Edition.

După cum sa menționat mai sus, este un motor de căutare pentru afaceri.

Obiectivele dvs. sunt diferite de un motor de căutare web, iar provocările tehnice sunt diferite.

Pentru un motor de căutare de afaceri, acesta trebuie să fie multi-sursă, multi-format și să gestioneze securitatea.

De asemenea, trebuie să vă permiteți să gestionați instrumentul. În versiunea gratuită, putem, din partea administrării:

  • Căutare textuală, inclusiv operatori booleeni
  • Un crawler bazat pe Apache ManifoldCF care permite indexarea CMS, site-uri web, fișiere partajate (Netapp, Samba, Windows), e-mailuri, baze de date, HDFS.
  • Analize „Full-text” și un sistem plug-in pentru adăugarea filtrelor de transformare în fazele de indexare și căutare
  • Interfață grafică în HTML5 și javascript care utilizează widget-uri HTML, în design receptiv
  • Utilizarea Apache Tika pentru a analiza și extrage conținut și metadate din diferite tipuri de documente (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3 ...)
  • Sistem de alertă prin e-mail pentru a primi notificări de rezultate noi în modul inserare (recepție de informații) în loc de modul extragere.

datafari-search-support

Pentru administratorii motoarelor de căutare

  • Instrument de analiză grafică interogare căutare utilizator.
  • Instrument de administrare Solr utilizat în Datafari.
  • Instrument pentru analiza randamentelor și calcularea relevanței interogărilor.
  • Instrument de administrare pentru securitate cu conexiune la AD sau LDAP.
  • Instrument pentru gestionarea sinonimelor.
  • Instrument pentru gestionarea linkurilor promoționale, permițând afișarea datelor care nu se află în index pentru cuvintele cheie identificate.
  • Instrument pentru gestionarea conectorilor de urmărire, cu mai multe surse de date comerciale (Sharepoint, fișiere partajate, e-mailuri, site-uri web, CMIS ...) și capacitatea de a crea altele noi.

Cum se obține Datafari?

Pentru cei care sunt interesați să obțină acest motor de căutare să știe ceva mai mult despre el și să știe dacă îl pot implementa în afacerile sau companiile lor, ar trebui să urmeze pașii următori.

Datafarian îl putem găsi preambalat printr-o mașină virtuală sau un container ancorabil sau puteți descărca instalarea pentru Debian sau Redhat (RHEL este disponibil numai cu Datafari Enterprise Edition).

la cei care sunt utilizatori de Debian, Ubuntu sau sisteme derivate pot utiliza pachetul deb furnizat de dezvoltatori de pe site-ul oficial al proiectului.

Ei trebuie să deschidă un terminal și să execute următoarea comandă:

wget https://www.datafari.com/files/debian/datafari.deb

Odată ce descărcarea este finalizată, continuăm să instalăm pachetul cu:

sudo dpkg -i datafari.deb

la toate celelalte distribuții Linux pot obține instalarea pe sistemele lor cu ajutorul containerelor docker deci pentru instalarea sa trebuie să aibă suport pentru aceasta și să instaleze cu următoarea comandă:

docker pull datafari/datafari

Pentru a începe imediat, este probabil cel mai bine urmați ghidul de pornire rapidă.


Lasă comentariul tău

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

*

*

  1. Responsabil pentru date: AB Internet Networks 2008 SL
  2. Scopul datelor: Control SPAM, gestionarea comentariilor.
  3. Legitimare: consimțământul dvs.
  4. Comunicarea datelor: datele nu vor fi comunicate terților decât prin obligație legală.
  5. Stocarea datelor: bază de date găzduită de Occentus Networks (UE)
  6. Drepturi: în orice moment vă puteți limita, recupera și șterge informațiile.