Datafari: en sökmotor med öppen källkod för företag

logotyp-datafari

Datafari är öppen källkod för företagssökning som använder Apache Solr för indexerings- och sökfaserna. Den kombinerar Apache ManifoldCF, Apache Solr och Apache Cassandra. baserat på HTML5, CSS3 och jQuery.

Detta är en paketerad sökmotor i den meningen att föreslår anslutningen till datakällorna, indexeringen, sökningen och den grafiska administrationen av systemet och distribueras med SolrCloud.

Datafari skapades av franska Labs France Labs sökte efter öppen källkod för att förbättra sin FoU med en ny intranätrelevansalgoritm.

Teamet upptäckte att ingenting var välskött och tillgängligt under en Apache-licens och skapade Datafari.

Han blev oberoende av forskningen om algoritmen och ansåg att den hade ett eget sökvärde.

Om Datafari

Denna sökmotor ger anställda möjlighet att hitta data var den än är, säker och säker.

Mer specifikt hämtar och indexerar Datafari data och dokument från olika källor och filformat, och tillåter sökning i både interna dokument och metadata.

Dessutom, ochDen är tillgänglig i en version med öppen källkod, kallad Datafari Community Edition, och i en proprietär version, som kallas Datafari Enterprise Edition.

Som nämnts ovan är det en sökmotor för företag.

Dina mål skiljer sig från en webbsökmotor, och de tekniska utmaningarna är annorlunda.

För en företagssökmotor måste den ha flera källor, flera format och hantera säkerhet.

Du måste också ha rätt att hantera verktyget. I den fria versionen kan vi, på administratörssidan:

  • Textsökning inklusive booleska operatorer
  • En sökrobot baserad på Apache ManifoldCF som tillåter indexering av CMS, webbplatser, filresurser (Netapp, Samba, Windows), e-postmeddelanden, databaser, HDFS.
  • "Fulltext"-analys och ett plugin-system för att lägga till transformationsfilter i indexerings- och sökfaserna
  • Grafiskt gränssnitt i HTML5 och javascript med HTML-widgets, i responsiv design
  • Använda Apache Tika för att analysera och extrahera innehåll och metadata från olika typer av dokument (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3...)
  • E-postvarningssystem för att ta emot meddelanden om nya resultat i push-läge (mottagning av information) istället för pull-läge.

datafari-search-support

För sökmotoradministratörer

  • Grafiskt analysverktyg för användarsökningsfrågor.
  • Solr administrationsverktyg som används i Datafari.
  • Verktyg för att analysera avkastningen och beräkningen av frågornas relevans.
  • Administrationsverktyg för säkerhet med anslutning till AD eller LDAP.
  • Verktyg för att hantera synonymer.
  • Verktyg för att hantera promolänkar, vilket gör att data som inte finns i indexet kan visas för de identifierade sökorden.
  • Verktyg för att hantera genomsökningsanslutningar, med flera kommersiella datakällor (Sharepoint, fildelning, e-post, webbplatser, CMIS...) och möjligheten att skapa nya.

Hur får man Datafari?

För de som är intresserade av att skaffa denna sökmotor för att lära sig lite mer om den och ta reda på om de kan implementera den i sina företag eller företag, måste de följa följande steg.

Datafari vi kan hitta den färdigförpackad genom en virtuell maskin eller en dockningsbehållare eller så kan du ladda ner installationen för Debian eller Redhat (RHEL är endast tillgängligt med Datafari Enterprise Edition.)

till de som är användare av Debian, Ubuntu eller härledda system de kan använda sig av deb-paketet som tillhandahålls av utvecklarna från projektets officiella webbplats.

De bör öppna en terminal och köra följande kommando:

wget https://www.datafari.com/files/debian/datafari.deb

När nedladdningen är klar fortsätter vi att installera paketet med:

sudo dpkg -i datafari.deb

till alla andra Linux-distributioner kan installeras på sina system med hjälp av dockningscontainrar så för installationen måste de ha stöd för det och installera med följande kommando:

docker pull datafari/datafari

För att komma igång direkt är det nog bäst att följ snabbstartsguiden.


Lämna din kommentar

Din e-postadress kommer inte att publiceras. Obligatoriska fält är markerade med *

*

*

  1. Ansvarig för data: AB Internet Networks 2008 SL
  2. Syftet med uppgifterna: Kontrollera skräppost, kommentarhantering.
  3. Legitimering: Ditt samtycke
  4. Kommunikation av uppgifterna: Uppgifterna kommer inte att kommuniceras till tredje part förutom enligt laglig skyldighet.
  5. Datalagring: databas värd för Occentus Networks (EU)
  6. Rättigheter: När som helst kan du begränsa, återställa och radera din information.