Datafari: otvorený zdrojový vyhľadávací nástroj pre podniky

logo-datafari

Datafarian je open source softvér podnikového vyhľadávania využívajúci Apache Solr pre fázy indexovania a vyhľadávania. Kombinuje Apache ManifoldCF, Apache Solr a Apache Cassandra. založené na HTML5, CSS3 a jQuery.

Toto je zbalený vyhľadávací nástroj v tom zmysle navrhuje pripojenie k zdrojom údajov, indexovanie, vyhľadávanie a správu grafického systému a je distribuovaný pomocou SolrCloud.

Datafarian bolo vytvorené Francúzskom Laboratóriá. Francúzsko Laboratóriá sa zamerali na softvér na vyhľadávanie otvoreného zdroja, aby zlepšili svoj výskum a vývoj pomocou nového algoritmu relevantnosti pre intranet.

Tím zistil, že v rámci licencie Apache nie je nič dobre udržiavané a dostupné a vytvoril Datafari.

Osamostatnil sa od výskumu algoritmu vzhľadom na to, že mal vlastnú vyhľadávaciu hodnotu.

O spoločnosti Datafari

Tento vyhľadávač umožňuje zamestnancom vyhľadávať údaje kdekoľvek sú, v bezpečí.

Presnejšie povedané, Datafari získava a indexuje údaje a dokumenty z rôznych zdrojov a formátov súborov a umožňuje vyhľadávať interné dokumenty aj metadáta.

Okrem toho aJe k dispozícii v otvorenej verzii s názvom Datafari Community Edition a v proprietárnej verzii s názvom Datafari Enterprise Edition.

Ako už bolo spomenuté vyššie, jedná sa o vyhľadávací nástroj pre podnikanie.

Vaše ciele sa líšia od webového vyhľadávacieho nástroja a odlišné sú aj technické výzvy.

Pre podnikový vyhľadávací modul musí byť zabezpečenie s viacerými zdrojmi, viacerými formátmi a správou zabezpečenia.

Musíte si tiež dovoliť správu tohto nástroja. V bezplatnej verzii môžeme na strane správy:

  • Textové vyhľadávanie vrátane logických operátorov
  • Prehľadávač založený na Apache ManifoldCF, ktorý umožňuje indexovanie CMS, webov, zdieľaných súborov (Netapp, Samba, Windows), e-mailov, databáz, HDFS.
  • „Fulltextová“ analytika a systém doplnkov na pridanie transformačných filtrov vo fázach indexovania a vyhľadávania
  • Grafické rozhranie v HTML5 a javascript, ktoré využíva HTML widgety, v responzívnom dizajne
  • Použitie Apache Tika na analýzu a extrakciu obsahu a metadát z rôznych typov dokumentov (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3 ...)
  • E-mailový výstražný systém na príjem upozornení na nové výsledky v režime vkladania (príjem informácií) namiesto režimu extrakcie.

podpora vyhľadávania údajov

Pre správcov vyhľadávacích nástrojov

  • Nástroj na grafickú analýzu vyhľadávacích dopytov používateľov.
  • Solr administračný nástroj používaný v Datafari.
  • Nástroj na analýzu výnosov a výpočet relevantnosti dotazov.
  • Nástroj na správu zabezpečenia s pripojením na AD alebo LDAP.
  • Nástroj na správu synoným.
  • Nástroj na správu promolinkov, ktorý umožňuje zobrazenie údajov, ktoré nie sú v indexe, pre identifikované kľúčové slová.
  • Nástroj na správu sledovacích konektorov s rôznymi zdrojmi komerčných údajov (Sharepoint, zdieľané súbory, e-maily, webové stránky, CMIS ...) a schopnosťou vytvárať nové.

Ako získať Datafari?

Pre tých, ktorí majú záujem o získanie tohto vyhľadávacieho nástroja, aby o ňom vedeli niečo viac a vedeli, či ho môžu implementovať vo svojich firmách alebo spoločnostiach, mali by postupovať podľa nasledujúcich krokov.

Datafarian nájdeme ho zabalený prostredníctvom virtuálneho počítača alebo dokovateľného kontajnera alebo si môžete stiahnuť inštaláciu pre Debian alebo Redhat (RHEL je k dispozícii iba s edíciou Datafari Enterprise Edition).

na tí, ktorí sú používateľmi Debianu, Ubuntu alebo odvodených systémov môžu využiť deb balík poskytnutý vývojármi z oficiálnych webových stránok projektu.

Musí otvoriť terminál a vykonať nasledujúci príkaz:

wget https://www.datafari.com/files/debian/datafari.deb

Po dokončení sťahovania pokračujeme v inštalácii balíka s:

sudo dpkg -i datafari.deb

na všetky ostatné distribúcie Linuxu môžu získať inštaláciu na svojich systémoch pomocou docker kontajnerov takže pre jeho inštaláciu musia mať jeho podporu a inštaláciu pomocou nasledujúceho príkazu:

docker pull datafari/datafari

Ak chcete začať hneď, je to asi najlepšie postupujte podľa príručky pre rýchly štart.


Zanechajte svoj komentár

Vaša e-mailová adresa nebude zverejnená. Povinné položky sú označené *

*

*

  1. Za údaje zodpovedá: AB Internet Networks 2008 SL
  2. Účel údajov: Kontrolný SPAM, správa komentárov.
  3. Legitimácia: Váš súhlas
  4. Oznamovanie údajov: Údaje nebudú poskytnuté tretím stranám, iba ak to vyplýva zo zákona.
  5. Ukladanie dát: Databáza hostená spoločnosťou Occentus Networks (EU)
  6. Práva: Svoje údaje môžete kedykoľvek obmedziť, obnoviť a vymazať.