Datafari: un moteur de recherche open source pour les entreprises

logo-datafari

Datafarien est un logiciel de recherche d'entreprise open source utilisant Apache Solr pour les phases d'indexation et de recherche. Il combine Apache ManifoldCF, Apache Solr et Apache Cassandra. basé sur HTML5, CSS3 et jQuery.

Il s'agit d'un moteur de recherche packagé dans le sens où propose la connexion aux sources de données, l'indexation, la recherche et l'administration du système graphique et est distribué à l'aide de SolrCloud.

Datafarien a été créé par la France Labs: France Labs s'est tourné vers un logiciel de recherche open source pour améliorer sa R&D avec un nouvel algorithme de pertinence intranet.

L'équipe a découvert qu'il n'y avait rien de bien entretenu et disponible sous une licence Apache et a créé Datafari.

Il est devenu indépendant de la recherche sur l'algorithme, considérant qu'il avait une valeur de recherche qui lui était propre.

À propos de Datafari

Ce moteur de recherche permet aux employés de trouver des données où qu'elles se trouvent, en toute sécurité.

Plus spécifiquement, Datafari récupère et indexe les données et les documents de différentes sources et formats de fichiers, et permet de rechercher à la fois des documents internes et des métadonnées.

En outre, etIl est disponible dans une version open source, appelée Datafari Community Edition, et dans une version propriétaire, appelée Datafari Enterprise Edition.

Comme mentionné ci-dessus, il s'agit d'un moteur de recherche pour les entreprises.

Vos objectifs sont différents d'un moteur de recherche Web et les défis techniques sont différents.

Pour un moteur de recherche d'entreprise, il doit être multi-source, multi-format et gérer la sécurité.

De plus, vous devez vous permettre de gérer l'outil. Dans la version gratuite, on peut, côté administration:

  • Recherche textuelle avec opérateurs booléens
  • Un robot d'exploration basé sur Apache ManifoldCF qui permet l'indexation de CMS, sites Web, fichiers partagés (Netapp, Samba, Windows), e-mails, bases de données, HDFS.
  • Analyse "plein texte" et système de plug-in pour ajouter des filtres de transformation dans les phases d'indexation et de recherche
  • Interface graphique en HTML5 et javascript utilisant des widgets HTML, en responsive design
  • Utilisation d'Apache Tika pour analyser et extraire le contenu et les métadonnées de différents types de documents (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3 ...)
  • Système d'alerte par e-mail pour recevoir les notifications de nouveaux résultats en mode insertion (réception d'informations) au lieu du mode extraction.

support de recherche datafari

Pour les administrateurs de moteurs de recherche

  • Outil d'analyse graphique des requêtes de recherche d'utilisateurs.
  • Outil d'administration Solr utilisé dans Datafari.
  • Outil d'analyse des rendements et de calcul de la pertinence des requêtes.
  • Outil d'administration pour la sécurité avec connexion à AD ou LDAP.
  • Outil de gestion des synonymes.
  • Outil de gestion des promolinks, permettant d'afficher les données qui ne sont pas dans l'index pour les mots-clés identifiés.
  • Outil de gestion des connecteurs de tracking, avec diverses sources de données commerciales (Sharepoint, fichiers partagés, emails, sites web, CMIS ...) et la possibilité d'en créer de nouvelles.

Comment obtenir Datafari?

Pour ceux qui souhaitent obtenir ce moteur de recherche pour en savoir un peu plus et savoir s'ils peuvent le mettre en œuvre dans leur entreprise ou entreprise, ils doivent suivre les étapes suivantes.

Datafarien nous pouvons le trouver pré-emballé via une machine virtuelle ou un conteneur ancrable ou vous pouvez télécharger l'installation pour Debian ou Redhat (RHEL n'est disponible qu'avec Datafari Enterprise Edition).

Pour ceux qui utilisent Debian, Ubuntu ou des systèmes dérivés ils peuvent utiliser le package deb fourni par les développeurs sur le site officiel du projet.

Ils doivent ouvrir un terminal et exécuter la commande suivante:

wget https://www.datafari.com/files/debian/datafari.deb

Une fois le téléchargement terminé, nous procédons à l'installation du package avec:

sudo dpkg -i datafari.deb

Pour toutes les autres distributions Linux peuvent obtenir l'installation sur leurs systèmes à l'aide de conteneurs docker donc pour son installation, ils doivent avoir le support et installer avec la commande suivante:

docker pull datafari/datafari

Pour commencer tout de suite, c'est probablement mieux suivez le guide de démarrage rapide.


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

*

*

  1. Responsable des données : AB Internet Networks 2008 SL
  2. Finalité des données: Contrôle du SPAM, gestion des commentaires.
  3. Légitimation: votre consentement
  4. Communication des données: Les données ne seront pas communiquées à des tiers sauf obligation légale.
  5. Stockage des données: base de données hébergée par Occentus Networks (EU)
  6. Droits: à tout moment, vous pouvez limiter, récupérer et supprimer vos informations.