Datafariano è un software di ricerca aziendale open source che utilizza Apache Solr per le fasi di indicizzazione e ricerca. Combina Apache ManifoldCF, Apache Solr e Apache Cassandra. basato su HTML5, CSS3 e jQuery.
Questo è un motore di ricerca pacchettizzato nel senso che propone la connessione a sorgenti dati, indicizzazione, ricerca e amministrazione del sistema grafico ed è distribuito utilizzando SolrCloud.
Datafariano è stato creato dalla Francia Labs. France Labs ha cercato un software di ricerca open source per migliorare la propria ricerca e sviluppo con un nuovo algoritmo di rilevanza intranet.
Il team ha scoperto che non c'era nulla di ben mantenuto e disponibile con una licenza Apache e ha creato Datafari.
È diventato indipendente dalla ricerca sull'algoritmo, considerando che aveva un valore di ricerca proprio.
A proposito di Datafari
Questo motore di ricerca consente ai dipendenti di trovare i dati ovunque si trovino, sicuri e protetti.
Più specificamente, Datafari recupera e indicizza dati e documenti da diverse fonti e formati di file e consente la ricerca sia di documenti interni che di metadati.
Inoltre, eÈ disponibile in una versione open source, denominata Datafari Community Edition, e in una versione proprietaria, denominata Datafari Enterprise Edition.
Come accennato in precedenza, è un motore di ricerca per le imprese.
I tuoi obiettivi sono diversi da un motore di ricerca web e le sfide tecniche sono diverse.
Per un motore di ricerca aziendale, deve essere multi-sorgente, multiformato e gestire la sicurezza.
Inoltre, devi consentire a te stesso di gestire lo strumento. Nella versione gratuita possiamo, lato amministrazione:
- Ricerca testuale inclusi operatori booleani
- Un crawler basato su Apache ManifoldCF che consente l'indicizzazione di CMS, siti Web, file condivisi (Netapp, Samba, Windows), e-mail, database, HDFS.
- Analisi "full-text" e un sistema di plug-in per l'aggiunta di filtri di trasformazione nelle fasi di indicizzazione e ricerca
- Interfaccia grafica in HTML5 e javascript che utilizza widget HTML, in responsive design
- Utilizzo di Apache Tika per analizzare ed estrarre contenuti e metadati da vari tipi di documenti (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3 ...)
- Sistema di allerta e-mail per ricevere notifiche di nuovi risultati in modalità di inserimento (ricezione delle informazioni) invece che in modalità di estrazione.
Per gli amministratori dei motori di ricerca
- Strumento di analisi grafica delle query di ricerca degli utenti.
- Strumento di amministrazione Solr utilizzato in Datafari.
- Strumento per analizzare i rendimenti e calcolare la rilevanza delle query.
- Strumento di amministrazione per la sicurezza con connessione ad AD o LDAP.
- Strumento per gestire i sinonimi.
- Strumento per la gestione dei promolink, che consente di visualizzare i dati non presenti nell'indice per le parole chiave identificate.
- Strumento per gestire i connettori di tracciamento, con varie fonti di dati commerciali (Sharepoint, file condivisi, email, siti web, CMIS ...) e la possibilità di crearne di nuovi.
Come ottenere Datafari?
Per coloro che sono interessati a ottenere questo motore di ricerca, per saperne di più e per sapere se possono implementarlo nelle loro attività o aziende, dovrebbero seguire i seguenti passaggi.
Datafariano possiamo trovarlo preconfezionato tramite una macchina virtuale o un contenitore agganciabile oppure puoi scaricare l'installazione per Debian o Redhat (RHEL è disponibile solo con Datafari Enterprise Edition).
a coloro che sono utenti di Debian, Ubuntu o sistemi derivati possono utilizzare il pacchetto deb fornito dagli sviluppatori dal sito web ufficiale del progetto.
Devono aprire un terminale ed eseguire il seguente comando:
wget https://www.datafari.com/files/debian/datafari.deb
Una volta terminato il download, procediamo all'installazione del pacchetto con:
sudo dpkg -i datafari.deb
a tutte le altre distribuzioni Linux possono ottenere l'installazione sui propri sistemi con l'aiuto dei contenitori Docker quindi per la sua installazione devono avere il supporto per esso e installare con il seguente comando:
docker pull datafari/datafari
Per iniziare subito, probabilmente è meglio segui la guida rapida.