Datafari: um mecanismo de pesquisa de código aberto para empresas

logo-datafari

Datafarian é um software de busca corporativa de código aberto que usa Apache Solr para as fases de indexação e pesquisa. Ele combina Apache ManifoldCF, Apache Solr e Apache Cassandra. baseado em HTML5, CSS3 e jQuery.

Este é um mecanismo de pesquisa empacotado no sentido de que propõe conexão a fontes de dados, indexação, pesquisa e administração gráfica do sistema e é distribuído usando SolrCloud.

Datafarian foi criado pela França Labs. A France Labs buscou um software de busca de código aberto para melhorar sua P&D com um novo algoritmo de relevância para a intranet.

A equipe descobriu que não havia nada bem mantido e disponível sob uma licença Apache e criou o Datafari.

Ele se tornou independente da pesquisa sobre o algoritmo, considerando que ele tinha um valor de pesquisa próprio.

Sobre o Datafari

Este motor de busca permite que os funcionários encontrem dados onde quer que estejam, seguros e protegidos.

Mais especificamente, o Datafari recupera e indexa dados e documentos de diferentes fontes e formatos de arquivo e permite a pesquisa de documentos internos e metadados.

Além disso, eEle está disponível em uma versão open source, chamada Datafari Community Edition, e em uma versão proprietária, chamada Datafari Enterprise Edition.

Como mencionado acima, é um mecanismo de busca para empresas.

Seus objetivos são diferentes de um mecanismo de pesquisa na web e os desafios técnicos são diferentes.

Para um mecanismo de pesquisa de negócios, ele deve ser multifacetado, multiformato e gerenciar a segurança.

Além disso, você deve permitir-se gerenciar a ferramenta. Na versão gratuita, podemos, do lado da administração:

  • Pesquisa textual incluindo operadores booleanos
  • Um rastreador baseado em Apache ManifoldCF que permite a indexação de CMS, sites, arquivos compartilhados (Netapp, Samba, Windows), e-mails, bancos de dados, HDFS.
  • Análise de "texto completo" e um sistema de plug-in para adicionar filtros de transformação nas fases de indexação e pesquisa
  • Interface gráfica em HTML5 e javascript que usa widgets HTML, em design responsivo
  • Uso do Apache Tika para analisar e extrair conteúdo e metadados de vários tipos de documentos (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3 ...)
  • Sistema de alerta por e-mail para receber notificações de novos resultados no modo de inserção (recepção de informações) ao invés do modo de extração.

suporte à pesquisa datafari

Para administradores de mecanismo de pesquisa

  • Ferramenta de análise gráfica de consulta de pesquisa do usuário.
  • Ferramenta de administração Solr usada no Datafari.
  • Ferramenta para analisar os rendimentos e calcular a relevância das consultas.
  • Ferramenta de administração para segurança com conexão a AD ou LDAP.
  • Ferramenta para gerenciar sinônimos.
  • Ferramenta para gerenciar links promocionais, permitindo que dados que não estão no índice sejam exibidos para as palavras-chave identificadas.
  • Ferramenta para gerenciar conectores de rastreamento, com várias fontes de dados comerciais (Sharepoint, arquivos compartilhados, emails, sites, CMIS ...) e a possibilidade de criar novos.

Como obter o Datafari?

Para aqueles que têm interesse em obter este buscador para saber um pouco mais sobre ele e saber se podem implementá-lo em seus negócios ou empresas, devem seguir os seguintes passos.

Datafarian podemos encontrá-lo pré-empacotado através de uma máquina virtual ou um contêiner encaixável ou você pode baixar a instalação para Debian ou Redhat (RHEL está disponível apenas com Datafari Enterprise Edition).

Pára aqueles que são usuários de Debian, Ubuntu ou sistemas derivados eles podem fazer uso do pacote deb fornecido pelos desenvolvedores no site oficial do projeto.

Eles devem abrir um terminal e executar o seguinte comando:

wget https://www.datafari.com/files/debian/datafari.deb

Assim que o download for concluído, procedemos à instalação do pacote com:

sudo dpkg -i datafari.deb

Pára todas as outras distribuições do Linux podem obter a instalação em seus sistemas com a ajuda de contêineres docker portanto para sua instalação devem ter o suporte para ele e instalar com o seguinte comando:

docker pull datafari/datafari

Para começar imediatamente, é provavelmente melhor siga o guia de início rápido.


Deixe um comentário

Seu endereço de email não será publicado. Campos obrigatórios são marcados com *

*

*

  1. Responsável pelos dados: AB Internet Networks 2008 SL
  2. Finalidade dos dados: Controle de SPAM, gerenciamento de comentários.
  3. Legitimação: Seu consentimento
  4. Comunicação de dados: Os dados não serão comunicados a terceiros, exceto por obrigação legal.
  5. Armazenamento de dados: banco de dados hospedado pela Occentus Networks (UE)
  6. Direitos: A qualquer momento você pode limitar, recuperar e excluir suas informações.