Datafari: otevřený vyhledávač pro firmy

logo-datafari

Datafarian je open source software pro podnikové vyhledávání využívající Apache Solr pro fáze indexování a vyhledávání. Kombinuje Apache ManifoldCF, Apache Solr a Apache Cassandra. na základě HTML5, CSS3 a jQuery.

Toto je zabalený vyhledávač v tom smyslu navrhuje připojení ke zdrojům dat, indexování, vyhledávání a správu grafického systému a je distribuován pomocí SolrCloud.

Datafarian byla vytvořena Francií Laboratoře Francie Laboratoře hledaly software pro vyhledávání v otevřeném zdrojovém kódu, aby zlepšily svůj výzkum a vývoj pomocí nového algoritmu relevance intranetu.

Tým zjistil, že neexistuje nic dobře udržovaného a dostupného pod licencí Apache, a vytvořil Datafari.

Osamostatnil se od výzkumu algoritmu, protože měl vlastní vyhledávací hodnotu.

O společnosti Datafari

Tento vyhledávač umožňuje zaměstnancům najít data, ať jsou kdekoli, bezpečná a zabezpečená.

Přesněji řečeno, Datafari načítá a indexuje data a dokumenty z různých zdrojů a formátů souborů a umožňuje vyhledávání jak interních dokumentů, tak metadat.

Kromě toho aJe k dispozici v otevřené verzi s názvem Datafari Community Edition a v proprietární verzi s názvem Datafari Enterprise Edition.

Jak již bylo zmíněno výše, jedná se o vyhledávač pro podnikání.

Vaše cíle se liší od webového vyhledávače a technické výzvy se liší.

Pro obchodní vyhledávač to musí být vícezdrojové, víceformátové a spravovat zabezpečení.

Musíte si také dovolit správu nástroje. V bezplatné verzi můžeme na straně administrace:

  • Textové vyhledávání včetně logických operátorů
  • Prohledávač založený na Apache ManifoldCF, který umožňuje indexování CMS, webů, sdílených souborů (Netapp, Samba, Windows), e-mailů, databází, HDFS.
  • „Fulltextová“ analytika a systém zásuvných modulů pro přidávání transformačních filtrů ve fázích indexování a vyhledávání
  • Grafické rozhraní v HTML5 a javascript, které používá HTML widgety, v responzivním designu
  • Použití Apache Tika k analýze a extrakci obsahu a metadat z různých typů dokumentů (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3 ...)
  • E-mailový výstražný systém pro příjem oznámení o nových výsledcích v režimu vkládání (příjem informací) místo režimu extrakce.

podpora vyhledávání dat

Pro správce vyhledávačů

  • Nástroj pro grafickou analýzu dotazů na vyhledávání uživatelů.
  • Nástroj pro správu solr používaný v Datafari.
  • Nástroj pro analýzu výnosů a výpočet relevance dotazů.
  • Nástroj pro správu zabezpečení s připojením k AD nebo LDAP.
  • Nástroj pro správu synonym.
  • Nástroj pro správu promolinků, který umožňuje zobrazení dat, která nejsou v indexu, pro identifikovaná klíčová slova.
  • Nástroj pro správu sledovacích konektorů s několika zdroji komerčních dat (Sharepoint, sdílené soubory, e-maily, webové stránky, CMIS ...) a schopností vytvářet nové.

Jak získat Datafari?

Pro ty, kteří mají zájem o získání tohoto vyhledávače, aby o něm věděli něco více a věděli, zda jej mohou implementovat ve svých podnicích nebo společnostech, měli by postupovat podle následujících kroků.

Datafarian najdeme ji zabalenou prostřednictvím virtuálního počítače nebo dokovatelného kontejneru nebo si můžete stáhnout instalaci pro Debian nebo Redhat (RHEL je k dispozici pouze u Datafari Enterprise Edition).

na ti, kteří jsou uživateli Debianu, Ubuntu nebo odvozených systémů mohou využít deb balíček poskytovaný vývojáři z oficiálních webových stránek projektu.

Musí otevřít terminál a provést následující příkaz:

wget https://www.datafari.com/files/debian/datafari.deb

Po dokončení stahování pokračujeme v instalaci balíčku pomocí:

sudo dpkg -i datafari.deb

na všechny ostatní distribuce Linuxu mohou získat instalaci na svých systémech pomocí ukotvitelných kontejnerů pro jeho instalaci musí mít podporu a nainstalovat pomocí následujícího příkazu:

docker pull datafari/datafari

Chcete-li začít hned, je to asi nejlepší postupujte podle průvodce rychlým startem.


Zanechte svůj komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *

*

*

  1. Za data odpovídá: AB Internet Networks 2008 SL
  2. Účel údajů: Ovládací SPAM, správa komentářů.
  3. Legitimace: Váš souhlas
  4. Sdělování údajů: Údaje nebudou sděleny třetím osobám, s výjimkou zákonných povinností.
  5. Úložiště dat: Databáze hostovaná společností Occentus Networks (EU)
  6. Práva: Vaše údaje můžete kdykoli omezit, obnovit a odstranit.