Datafari:面向企业的开源搜索引擎

徽标数据集

数据法里 是使用Apache Solr的开源企业搜索软件 用于索引和搜索阶段。 它结合了Apache ManifoldCF,Apache Solr和Apache Cassandra。 基于HTML5,CSS3和jQuery。

从某种意义上说,这是一个打包的搜索引擎 提出与数据源,索引,搜索和图形系统管理的连接 并使用SolrCloud分发。

数据法里 由法国创建 Labs。France Labs希望使用新的Intranet关联算法来开放源代码搜索软件,以改善其研发水平。

团队发现,在Apache许可下,没有什么东西可以很好地维护和使用,并创建了Datafari。

考虑到它具有自己的搜索价值,他脱离了对该算法的研究。

关于Datafari

这个搜寻引擎 使员工无论身在何处都可以安全可靠地查找数据.

更具体地说,Datafari从不同的源和文件格式检索数据和文档并为其建立索引,并允许搜索内部文档和元数据。

此外,以及它有称为Datafari Community Edition的开源版本和称为Datafari Enterprise Edition的专有版本。

如上所述,它是企业搜索引擎。

您的目标与网络搜索引擎不同,技术挑战也不同。

对于企业搜索引擎,它必须是多源,多种格式并管理安全性。

另外,您必须允许自己管理该工具。 在免费版本中,我们可以在管理方面:

  • 文本搜索,包括布尔运算符
  • 一个基于Apache ManifoldCF的搜寻器,允许对CMS,网站,共享文件(Netapp,Samba,Windows),电子邮件,数据库,HDFS进行索引。
  • “全文”分析和一个插件系统,用于在索引和搜索阶段添加转换过滤器
  • 响应式设计中的HTML5和使用HTML小部件的javascript中的图形界面
  • 使用Apache Tika分析和提取各种类型的文档(MSOffice,OpenOffice,HTML,XML,PDF,RTF,TXT,ZIP,EXIF,MP3等)中的内容和元数据
  • 电子邮件警报系统以插入模式(信息接收)而不是提取模式接收新结果的通知。

datafari-搜索-支持

对于搜索引擎管理员

  • 用户搜索查询图形分析工具。
  • Datafari中使用的Solr管理工具。
  • 用于分析收益并计算查询相关性的工具。
  • 管理工具,用于连接到AD或LDAP的安全性。
  • 管理同义词的工具。
  • 用于管理促销链接的工具,允许针对所标识的关键字显示索引中未包含的数据。
  • 用于管理跟踪连接器的工具,具有各种商业数据源(Sharepoint,共享文件,电子邮件,网站,CMIS ...)以及创建新数据的能力。

如何获得Datafari?

对于那些有兴趣获得此搜索引擎的人,要了解更多信息并知道是否可以在其业务或公司中实施它,则应遵循以下步骤。

数据法里 我们可以找到它是通过虚拟机或可停靠容器预先打包的,也可以下载Debian或Redhat的安装 (RHEL仅适用于Datafari Enterprise Edition)。

使用Debian,Ubuntu或派生系统的用户 他们可以使用开发人员从项目官方网站提供的deb软件包。

他们必须打开终端并执行以下命令:

wget https://www.datafari.com/files/debian/datafari.deb

下载完成后,我们将通过以下方式安装软件包:

sudo dpkg -i datafari.deb

所有其他Linux发行版都可以借助Docker容器在其系统上进行安装 因此,对于其安装,他们必须对此具有支持并使用以下命令进行安装:

docker pull datafari/datafari

立即开始,这可能是最好的 按照快速入门指南进行操作。


发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责资料:AB Internet Networks 2008 SL
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。