Datafari: un motor de cerca de codi obert per a empreses

logo-datafari

Datafari és un programari de recerca empresarial de codi obert que utilitza Apache Solr per a les fases d'indexació i cerca. Combina Apache ManifoldCF, Apache Solr i Apache Cassandra. basat en HTML5, CSS3 i jQuery.

Aquest és un motor de cerca empaquetat en el sentit que proposa la connexió a les fonts de dades, la indexació, la recerca i l'administració gràfica de sistema i es distribueix utilitzant SolrCloud.

Datafari va ser creat per France Labs. France Labs va buscar un programari de recerca de codi obert per millorar la seva R + D amb un nou algoritme de rellevància d'intranet.

L'equip va descobrir que no hi havia res ben mantingut i disponible sota una Llicència Apache i va crear Datafari.

Es va independitzar de la investigació sobre l'algoritme, considerant que tenia un valor de cerca en si mateix.

sobre Datafari

Aquest motor de cerca permet als empleats trobar dades on sigui que estiguin, assegurances i protegits.

Més específicament, Datafari recupera i indexa dades i documents de diferents fonts i formats d'arxiu, i permet buscar tant documents interns com metadades.

A més istà disponible en versió de codi obert, anomenada Datafari Community Edition, i en versió propietària, anomenada Datafari Enterprise Edition.

Com s'ha esmentat anteriorment, és un motor de cerca per negocis.

Els seus objectius són diferents d'un motor de cerca web, i els desafiaments tècnics són diferents.

Per a un motor de cerca per a negocis, ha de ser de font múltiple, multiformat i administrar la seguretat.

A més, s'ha de permetre administrar l'eina. En la versió gratuïta, podem, al costat d'administració:

  • Cerca textual incloent operadors booleans
  • Un rastrejador basat en Apache ManifoldCF que permet la indexació de CMS, llocs web, arxius compartits (NetApp, Samba, Windows), correus electrònics, bases de dades, HDFS.
  • Anàlisi de «text complet» i un sistema de complement per afegir filtres de transformació en les fases d'indexació i recerca
  • Interfície gràfica en HTML5 i Javascript que utilitza ginys HTML, en disseny receptiu
  • Ús d'Apache Tika per analitzar i extreure contingut i metadades de diversos tipus de documents (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3 ...)
  • Sistema d'alerta de correu electrònic per rebre notificacions de nous resultats en mode d'inserció (recepció d'informació) en lloc de manera d'extracció.

datafari-search-support

Per als administradors de l'motor de cerca

  • Eina d'anàlisi gràfica de consultes de cerca d'usuaris.
  • Eina d'administració de l'Solr utilitzat en Datafari.
  • Eina per analitzar els rendiments i el càlcul de rellevància de les consultes.
  • Eina d'administració per seguretat amb connexió a AD o LDAP.
  • Eina per gestionar sinònims.
  • Eina per administrar promolinks, permetent que les dades que no estan en l'índex es mostrin per a les paraules claus identificades.
  • Eina per administrar connectors de rastreig, amb diverses fonts de dades comercials (Sharepoint, arxius compartits, correus electrònics, llocs web, CMIS ...) i la capacitat de crear noves.

Com obtenir Datafari?

Per als que estiguin interessats a obtenir aquest motor de cerca per conèixer una mica més sobre ell i saber si poden implementar en els seus negocis o empreses deuen seguir els següents passos.

Datafari el podem trobar preempacado a través d'una màquina virtual o un contenidor acoblable o poden descarregar la instal·lació de Debian o Redhat (RHEL només està disponible amb Datafari Enterprise Edition).

Per a la els que siguin usuaris de Debian, Ubuntu o sistemes derivats poden fer ús de l'paquet deb que proporcionen els desenvolupadors des de la pàgina web oficial de el projecte.

Han d'obrir una terminal i executar la següent comanda:

wget https://www.datafari.com/files/debian/datafari.deb

Feta la descàrrega procedim a instal·lar el paquet amb:

sudo dpkg -i datafari.deb

Per a la la resta de les distribucions de Linux poden obtenir la instal·lació en els seus sistemes amb ajuda dels contenidors de docker de manera que per la seva instal·lació deuen comptar amb el suport per a això i instal·len amb la següent comanda:

docker pull datafari/datafari

Per començar immediatament, probablement el millor sigui seguir la guia d'inici ràpid.


Sigues el primer a comentar

Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: AB Internet Networks 2008 SL
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.