Datafari: een open source zoekmachine voor bedrijven

logo-datafari

datafari is open source enterprise search-software die gebruikmaakt van Apache Solr voor de indexerings- en zoekfasen. Het combineert Apache ManifoldCF, Apache Solr en Apache Cassandra. gebaseerd op HTML5, CSS3 en jQuery.

Dit is een verpakte zoekmachine in de zin dat stelt verbinding met gegevensbronnen, indexering, zoeken en grafisch systeembeheer voor en wordt gedistribueerd met SolrCloud.

datafari is gemaakt door Frankrijk Labs.Frankrijk Labs zocht naar open source zoeksoftware om hun R&D te verbeteren met een nieuw intranetrelevantie-algoritme.

Het team ontdekte dat er niets goed onderhouden en beschikbaar was onder een Apache-licentie en creëerde Datafari.

Hij werd onafhankelijk van onderzoek naar het algoritme, aangezien het een eigen zoekwaarde had.

Over Datafari

Deze zoekmachine stelt medewerkers in staat om gegevens te vinden waar ze zich ook bevinden, veilig en beveiligd.

Meer specifiek haalt Datafari gegevens en documenten op uit verschillende bronnen en bestandsformaten en indexeert ze, en maakt het zoeken naar zowel interne documenten als metadata mogelijk.

Trouwens, enHet is beschikbaar in een open source-versie, genaamd Datafari Community Edition, en in een eigen versie, genaamd Datafari Enterprise Edition.

Zoals hierboven vermeld, is het een zoekmachine voor bedrijven.

Uw doelen zijn anders dan die van een webzoekmachine en de technische uitdagingen zijn anders.

Voor een zakelijke zoekmachine moet deze uit meerdere bronnen bestaan, meerdere indelingen bevatten en de beveiliging beheren.

Je moet jezelf ook toestaan ​​om de tool te beheren. In de gratis versie kunnen we aan de administratieve kant:

  • Tekstueel zoeken inclusief Booleaanse operatoren
  • Een op Apache ManifoldCF gebaseerde crawler waarmee CMS, websites, gedeelde bestanden (Netapp, Samba, Windows), e-mails, databases, HDFS kunnen worden geïndexeerd.
  • "Full-text" -analyses en een plug-insysteem voor het toevoegen van transformatiefilters in de indexerings- en zoekfasen
  • Grafische interface in HTML5 en javascript die HTML-widgets gebruikt, in responsive design
  • Gebruik van Apache Tika om inhoud en metadata te analyseren en extraheren uit verschillende soorten documenten (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3 ...)
  • E-mailwaarschuwingssysteem om meldingen van nieuwe resultaten te ontvangen in invoegmodus (informatieontvangst) in plaats van extractiemodus.

datafari-zoeken-ondersteuning

Voor beheerders van zoekmachines

  • Hulpprogramma voor grafische analyse van gebruikerszoekopdrachten.
  • Solr-beheertool gebruikt in Datafari.
  • Tool voor het analyseren van de opbrengsten en het berekenen van de relevantie van zoekopdrachten.
  • Beheerstool voor beveiliging met verbinding met AD of LDAP.
  • Tool om synoniemen te beheren.
  • Tool om promolinks te beheren, waardoor gegevens die niet in de index staan, kunnen worden weergegeven voor de geïdentificeerde trefwoorden.
  • Tool om trackingconnectoren te beheren, met verschillende bronnen van commerciële gegevens (Sharepoint, gedeelde bestanden, e-mails, websites, CMIS ...) en de mogelijkheid om nieuwe te creëren.

Hoe krijg ik Datafari?

Voor degenen die geïnteresseerd zijn in het verkrijgen van deze zoekmachine om er iets meer over te weten en om te weten of ze deze in hun bedrijven of bedrijven kunnen implementeren, moeten ze de volgende stappen volgen.

datafari we kunnen het voorverpakt vinden via een virtuele machine of een dockbare container of u kunt de installatie downloaden voor Debian of Redhat (RHEL is alleen beschikbaar met Datafari Enterprise Edition).

naar gebruikers van Debian, Ubuntu of afgeleide systemen ze kunnen gebruik maken van het deb-pakket dat door de ontwikkelaars wordt geleverd vanaf de officiële website van het project.

Ze moeten een terminal openen en de volgende opdracht uitvoeren:

wget https://www.datafari.com/files/debian/datafari.deb

Zodra de download is voltooid, gaan we verder met het installeren van het pakket met:

sudo dpkg -i datafari.deb

naar alle andere Linux-distributies kunnen de installatie op hun systemen krijgen met behulp van docker-containers dus voor de installatie moeten ze de ondersteuning ervoor hebben en installeren met het volgende commando:

docker pull datafari/datafari

Om meteen aan de slag te gaan, is dit waarschijnlijk het beste volg de snelstartgids.


Laat je reactie achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *

*

*

  1. Verantwoordelijk voor de gegevens: AB Internet Networks 2008 SL
  2. Doel van de gegevens: Controle SPAM, commentaarbeheer.
  3. Legitimatie: uw toestemming
  4. Mededeling van de gegevens: De gegevens worden niet aan derden meegedeeld, behalve op grond van wettelijke verplichting.
  5. Gegevensopslag: database gehost door Occentus Networks (EU)
  6. Rechten: u kunt uw gegevens op elk moment beperken, herstellen en verwijderen.