Datafari: un motor de búsqueda de código abierto para empresas

logo-datafari

Datafari es un software de búsqueda empresarial de código abierto que utiliza Apache Solr para las fases de indexación y búsqueda. Combina Apache ManifoldCF, Apache Solr y Apache Cassandra. basado en HTML5, CSS3 y jQuery.

Este es un motor de búsqueda empaquetado en el sentido de que propone la conexión a las fuentes de datos, la indexación, la búsqueda y la administración gráfica del sistema y se distribuye utilizando SolrCloud.

Datafari fue creado por France Labs. France Labs buscó un software de búsqueda de código abierto para mejorar su I + D con un nuevo algoritmo de relevancia de intranet.

El equipo descubrió que no había nada bien mantenido y disponible bajo una Licencia Apache y creó Datafari.

Se independizó de la investigación sobre el algoritmo, considerando que tenía un valor de búsqueda en sí mismo.

Sobre Datafari

Este motor de búsqueda permite a los empleados encontrar datos donde sea que estén, seguros y protegidos.

Más específicamente, Datafari recupera e indexa datos y documentos de diferentes fuentes y formatos de archivo, y permite buscar tanto documentos internos como metadatos.

Además está disponible en versión de código abierto, llamada Datafari Community Edition, y en versión propietaria, llamada Datafari Enterprise Edition.

Como se mencionó anteriormente, es un motor de búsqueda para negocios.

Sus objetivos son diferentes de un motor de búsqueda web, y los desafíos técnicos son diferentes.

Para un motor de búsqueda para negocios, debe ser de fuente múltiple, multiformato y administrar la seguridad.

Además, debe permitirse administrar la herramienta. En la versión gratuita, podemos, en el lado de administración:

  • Búsqueda textual incluyendo operadores booleanos
  • Un rastreador basado en Apache ManifoldCF que permite la indexación de CMS, sitios web, archivos compartidos (Netapp, Samba, Windows), correos electrónicos, bases de datos, HDFS.
  • Análisis de «texto completo» y un sistema de complemento para agregar filtros de transformación en las fases de indexación y búsqueda
  • Interfaz gráfica en HTML5 y javascript que utiliza widgets HTML, en diseño receptivo
  • Uso de Apache Tika para analizar y extraer contenido y metadatos de varios tipos de documentos (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3 …)
  • Sistema de alerta de correo electrónico para recibir notificaciones de nuevos resultados en modo de inserción (recepción de información) en lugar de modo de extracción.

datafari-search-support

Para los administradores del motor de búsqueda

  • Herramienta de análisis gráfico de consultas de búsqueda de usuarios.
  • Herramienta de administración del Solr utilizado en Datafari.
  • Herramienta para analizar los rendimientos y el cálculo de relevancia de las consultas.
  • Herramienta de administración para seguridad con conexión a AD o LDAP.
  • Herramienta para gestionar sinónimos.
  • Herramienta para administrar promolinks, permitiendo que los datos que no están en el índice se muestren para las palabras claves identificadas.
  • Herramienta para administrar conectores de rastreo, con varias fuentes de datos comerciales (Sharepoint, archivos compartidos, correos electrónicos, sitios web, CMIS …) y la capacidad de crear nuevas.

¿Cómo obtener Datafari?

Para quienes estén interesados en obtener este motor de búsqueda para conocer un poco más sobre él y saber si pueden implementarlo en sus negocios o empresas deben de seguir los siguientes pasos.

Datafari lo podemos encontrar preempacado a través de una máquina virtual o un contenedor acoplable o pueden descargar la instalación para Debian o Redhat (RHEL solo está disponible con Datafari Enterprise Edition).

Para los que sean usuarios de Debian, Ubuntu o sistemas derivados pueden hacer uso del paquete deb que proporcionan los desarrolladores desde la página web oficial del proyecto.

Deben de abrir una terminal y ejecutar el siguiente comando:

wget https://www.datafari.com/files/debian/datafari.deb

Hecha la descarga procedemos a instalar el paquete con:

sudo dpkg -i datafari.deb

Para el resto de las distribuciones de Linux pueden obtener la instalación en sus sistemas con ayuda de los contenedores de docker por lo que para su instalación deben de contar con el soporte para ello e instalan con el siguiente comando:

docker pull datafari/datafari

Para comenzar de inmediato, probablemente lo mejor sea seguir la guía de inicio rápido.


Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: AB Internet Networks 2008 SL
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.