Datafari: avatud lähtekoodiga otsingumootor ettevõtetele

logo-datafari

Datafarian on avatud lähtekoodiga ettevõtte otsingutarkvara, mis kasutab Apache Solri indekseerimise ja otsingu etappide jaoks. See ühendab Apache ManifoldCF, Apache Solr ja Apache Cassandra. põhineb HTML5, CSS3 ja jQuery.

See on selles mõttes pakendatud otsingumootor teeb ettepaneku ühendada andmeallikatega, indekseerida, otsida ja süsteemi graafiliselt hallata ja seda levitatakse SolrCloudi abil.

Datafarian loodi Prantsusmaa poolt France Labs soovis uue sisevõrgu asjakohasuse algoritmi abil uurimis- ja arendustegevuse täiustamiseks kasutada avatud lähtekoodiga otsingu tarkvara.

Meeskond avastas, et Apache'i litsentsi alusel pole midagi hästi hooldatud ja saadaval ja lõi Datafari.

Ta muutus algoritmi uurimisest sõltumatuks, leides, et sellel on oma otsingu väärtus.

Datafari kohta

See otsingumootor võimaldab töötajatel leida andmeid kõikjalt, turvaliselt ja turvaliselt.

Täpsemalt otsib ja indekseerib Datafari andmeid ja dokumente erinevatest allikatest ja failivormingutest ning võimaldab otsida nii sisedokumente kui ka metaandmeid.

Pealegi jaSee on saadaval avatud lähtekoodiga versioonis nimega Datafari Community Edition ja varalises versioonis nimega Datafari Enterprise Edition.

Nagu eespool mainitud, on see ettevõtte otsingumootor.

Teie eesmärgid erinevad veebiotsingumootorist ja tehnilised väljakutsed on erinevad.

Ettevõtte otsingumootori jaoks peab see olema mitme allikaga, mitme vorminguga ja haldama turvalisust.

Samuti peate lubama tööriista haldamist. Tasuta versioonis saame administratsiooni poolel:

  • Tekstiline otsing, sealhulgas Boole'i ​​operaatorid
  • Apache ManifoldCF-põhine indekseerija, mis võimaldab CMS-i, veebisaitide, jagatud failide (Netapp, Samba, Windows), meilide, andmebaaside, HDFS-i indekseerimist.
  • "Täisteksti" analüütika ja pistikprogramm transformatsioonifiltrite lisamiseks indekseerimise ja otsingu faasis
  • Graafiline liides HTML5-s ja javascript, mis kasutab HTML-i vidinaid tundlikus kujunduses
  • Apache Tika kasutamine sisu ja metaandmete analüüsimiseks ja väljavõtmiseks erinevat tüüpi dokumentidest (MSOffice, OpenOffice, HTML, XML, PDF, RTF, TXT, ZIP, EXIF, MP3 ...)
  • E-posti hoiatussüsteem uute tulemuste teadete saamiseks väljavõtte režiimi asemel sisestusrežiimis (teabe vastuvõtt).

datafari-otsingu-tugi

Otsingumootorite administraatoritele

  • Kasutaja otsingupäringu graafilise analüüsi tööriist.
  • Datafaris kasutatav Solri haldustööriist.
  • Tööriist tootluste analüüsimiseks ja päringute asjakohasuse arvutamiseks.
  • Haldustööriist turvalisuse tagamiseks ühenduse loomisega AD või LDAP-ga.
  • Tööriist sünonüümide haldamiseks.
  • Tööriist promolinkide haldamiseks, võimaldades tuvastatud märksõnade puhul kuvada andmeid, mida indeksis pole.
  • Tööriist jälgimiskonnektorite haldamiseks koos mitmesuguste kommertsandmete allikatega (Sharepoint, jagatud failid, meilid, veebisaidid, CMIS ...) ja uute loomise võimalusega.

Kuidas Datafari saada?

Neile, kes on huvitatud selle otsingumootori hankimisest, teadma sellest veidi rohkem ja teadma, kas nad saavad seda oma ärides või ettevõtetes rakendada, peaksid nad järgima järgmisi samme.

Datafarian leiame selle pakendatud läbi virtuaalse masina või dokitava konteineri või saate alla laadida Debiani või Redhati installimise (RHEL on saadaval ainult koos Datafari Enterprise Editioniga).

et need, kes on Debiani, Ubuntu või tuletatud süsteemide kasutajad nad saavad kasutada debati paketti, mille arendajad pakuvad projekti ametlikult veebisaidilt.

Nad peavad avama terminali ja käivitama järgmise käsu:

wget https://www.datafari.com/files/debian/datafari.deb

Kui allalaadimine on lõppenud, jätkame paketi installimist järgmisega:

sudo dpkg -i datafari.deb

et kõik muud Linuxi distributsioonid saavad oma süsteemidesse installida dokkerikonteinerite abil nii et selle installimiseks peab neil olema selle tugi ja installima järgmise käsuga:

docker pull datafari/datafari

Kohe alustamiseks on see ilmselt parim järgige kiirjuhendit.


Jäta oma kommentaar

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on tähistatud *

*

*

  1. Andmete eest vastutav: AB Internet Networks 2008 SL
  2. Andmete eesmärk: Rämpsposti kontrollimine, kommentaaride haldamine.
  3. Seadustamine: teie nõusolek
  4. Andmete edastamine: andmeid ei edastata kolmandatele isikutele, välja arvatud juriidilise kohustuse alusel.
  5. Andmete salvestamine: andmebaas, mida haldab Occentus Networks (EL)
  6. Õigused: igal ajal saate oma teavet piirata, taastada ja kustutada.