Datafari: işletmeler için açık kaynaklı bir arama motoru

logo-datafari

Verifari Apache Solr kullanan açık kaynaklı bir kurumsal arama yazılımıdır indeksleme ve arama aşamaları için. Apache ManifoldCF, Apache Solr ve Apache Cassandra'yı birleştirir. HTML5, CSS3 ve jQuery tabanlı.

Bu, şu anlamda paketlenmiş bir arama motorudur: veri kaynakları, indeksleme, arama ve grafiksel sistem yönetimine bağlantı önerir ve SolrCloud kullanılarak dağıtılır.

Verifari Fransa tarafından oluşturuldu Labs. France Labs, Ar-Ge'sini yeni bir intranet alaka düzeyi algoritmasıyla geliştirmek için açık kaynaklı arama yazılımı arayışına girdi.

Ekip, Apache Lisansı altında bakımlı ve kullanılabilir hiçbir şeyin olmadığını keşfetti ve Datafari'yi yarattı.

Algoritmanın kendine ait bir arama değeri olduğunu düşünerek, algoritma üzerindeki araştırmalardan bağımsız hale geldi.

Datafari hakkında

Bu arama motoru çalışanların verileri nerede, güvenli ve emniyetli bir şekilde bulmasını sağlar.

Daha spesifik olarak, Datafari, verileri ve belgeleri farklı kaynaklardan ve dosya biçimlerinden alır ve dizine ekler ve hem dahili belgelerin hem de meta verilerin aranmasına izin verir.

Ayrıca veDatafari Community Edition adlı açık kaynaklı bir sürümde ve Datafari Enterprise Edition adlı tescilli bir sürümde mevcuttur.

Yukarıda belirtildiği gibi, iş için bir arama motorudur.

Hedefleriniz bir web arama motorundan farklıdır ve teknik zorluklar farklıdır.

Bir işletme arama motoru için, çok kaynaklı, çok formatlı olmalı ve güvenliği yönetmelidir.

Ayrıca, aracı yönetme konusunda kendinize izin vermelisiniz. Ücretsiz sürümde, yönetim tarafında şunları yapabiliriz:

  • Boole operatörleri dahil metin araması
  • CMS, web siteleri, paylaşılan dosyalar (Netapp, Samba, Windows), e-postalar, veritabanları, HDFS'nin endekslenmesine izin veren Apache ManifoldCF tabanlı bir tarayıcı.
  • Dizin oluşturma ve arama aşamalarında dönüşüm filtreleri eklemek için "Tam metin" analitiği ve bir eklenti sistemi
  • Duyarlı tasarımda HTML parçacıkları kullanan HTML5 ve javascript'te grafik arayüz
  • Çeşitli belge türlerinden (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3 ...) içerik ve meta verileri analiz etmek ve çıkarmak için Apache Tika'nın kullanılması
  • Çıkarma modu yerine ekleme modunda (bilgi alımı) yeni sonuçların bildirimlerini almak için e-posta uyarı sistemi.

datafari-arama-desteği

Arama motoru yöneticileri için

  • Kullanıcı arama sorgusu grafiksel analiz aracı.
  • Datafari'de kullanılan Solr yönetim aracı.
  • Verimleri analiz etmek ve sorguların alaka düzeyini hesaplamak için bir araç.
  • AD veya LDAP bağlantısıyla güvenlik için yönetim aracı.
  • Eşanlamlıları yönetmek için bir araç.
  • Tanıtım bağlantılarını yöneten araç, dizinde olmayan verilerin tanımlanan anahtar kelimeler için görüntülenmesine izin verir.
  • Çeşitli ticari veri kaynakları (Sharepoint, paylaşılan dosyalar, e-postalar, web siteleri, CMIS ...) ve yenilerini oluşturma yeteneği ile izleme bağlayıcılarını yönetme aracı.

Datafari nasıl alınır?

Bu arama motorunu edinmek isteyenler, biraz daha fazla bilgi sahibi olmak ve bunu işlerinde veya şirketlerinde uygulayıp uygulayamayacaklarını bilmek için aşağıdaki adımları takip etmelidirler.

Verifari bir sanal makine veya kenetlenebilir bir konteyner aracılığıyla önceden paketlenmiş olarak bulabiliriz veya Debian veya Redhat için kurulumu indirebilirsiniz (RHEL yalnızca Datafari Enterprise Edition ile kullanılabilir).

Daha Debian, Ubuntu veya türetilmiş sistemlerin kullanıcıları olanlar geliştiriciler tarafından projenin resmi web sitesinden sağlanan deb paketini kullanabilirler.

Bir terminal açmalı ve aşağıdaki komutu yürütmelidirler:

wget https://www.datafari.com/files/debian/datafari.deb

İndirme işlemi tamamlandıktan sonra, paketi şu şekilde kurmaya devam ediyoruz:

sudo dpkg -i datafari.deb

Daha diğer tüm Linux dağıtımları, docker container'larının yardımıyla sistemlerine yükleme yapabilir bu nedenle kurulum için destek almalı ve aşağıdaki komutla kurulmalıdır:

docker pull datafari/datafari

Hemen başlamak için muhtemelen en iyisi hızlı başlangıç ​​kılavuzunu izleyin.


Yorumunuzu bırakın

E-posta hesabınız yayınlanmayacak. Gerekli alanlar ile işaretlenmiştir *

*

*

  1. Verilerden sorumlu: AB Internet Networks 2008 SL
  2. Verilerin amacı: Kontrol SPAM, yorum yönetimi.
  3. Meşruiyet: Onayınız
  4. Verilerin iletilmesi: Veriler, yasal zorunluluk dışında üçüncü kişilere iletilmeyecektir.
  5. Veri depolama: Occentus Networks (AB) tarafından barındırılan veritabanı
  6. Haklar: Bilgilerinizi istediğiniz zaman sınırlayabilir, kurtarabilir ve silebilirsiniz.