数据法里 是使用Apache Solr的开源企业搜索软件 用于索引和搜索阶段。 它结合了Apache ManifoldCF,Apache Solr和Apache Cassandra。 基于HTML5,CSS3和jQuery。
从某种意义上说,这是一个打包的搜索引擎 提出与数据源,索引,搜索和图形系统管理的连接 并使用SolrCloud分发。
数据法里 由法国创建 Labs。France Labs希望使用新的Intranet关联算法来开放源代码搜索软件,以改善其研发水平。
团队发现,在Apache许可下,没有什么东西可以很好地维护和使用,并创建了Datafari。
考虑到它具有自己的搜索价值,他脱离了对该算法的研究。
关于Datafari
这个搜寻引擎 使员工无论身在何处都可以安全可靠地查找数据.
更具体地说,Datafari从不同的源和文件格式检索数据和文档并为其建立索引,并允许搜索内部文档和元数据。
此外,以及它有称为Datafari Community Edition的开源版本和称为Datafari Enterprise Edition的专有版本。
如上所述,它是企业搜索引擎。
您的目标与网络搜索引擎不同,技术挑战也不同。
对于企业搜索引擎,它必须是多源,多种格式并管理安全性。
另外,您必须允许自己管理该工具。 在免费版本中,我们可以在管理方面:
- 文本搜索,包括布尔运算符
- 一个基于Apache ManifoldCF的搜寻器,允许对CMS,网站,共享文件(Netapp,Samba,Windows),电子邮件,数据库,HDFS进行索引。
- “全文”分析和一个插件系统,用于在索引和搜索阶段添加转换过滤器
- 响应式设计中的HTML5和使用HTML小部件的javascript中的图形界面
- 使用Apache Tika分析和提取各种类型的文档(MSOffice,OpenOffice,HTML,XML,PDF,RTF,TXT,ZIP,EXIF,MP3等)中的内容和元数据
- 电子邮件警报系统以插入模式(信息接收)而不是提取模式接收新结果的通知。
对于搜索引擎管理员
- 用户搜索查询图形分析工具。
- Datafari中使用的Solr管理工具。
- 用于分析收益并计算查询相关性的工具。
- 管理工具,用于连接到AD或LDAP的安全性。
- 管理同义词的工具。
- 用于管理促销链接的工具,允许针对所标识的关键字显示索引中未包含的数据。
- 用于管理跟踪连接器的工具,具有各种商业数据源(Sharepoint,共享文件,电子邮件,网站,CMIS ...)以及创建新数据的能力。
如何获得Datafari?
对于那些有兴趣获得此搜索引擎的人,要了解更多信息并知道是否可以在其业务或公司中实施它,则应遵循以下步骤。
数据法里 我们可以找到它是通过虚拟机或可停靠容器预先打包的,也可以下载Debian或Redhat的安装 (RHEL仅适用于Datafari Enterprise Edition)。
至 使用Debian,Ubuntu或派生系统的用户 他们可以使用开发人员从项目官方网站提供的deb软件包。
他们必须打开终端并执行以下命令:
wget https://www.datafari.com/files/debian/datafari.deb
下载完成后,我们将通过以下方式安装软件包:
sudo dpkg -i datafari.deb
至 所有其他Linux发行版都可以借助Docker容器在其系统上进行安装 因此,对于其安装,他们必须对此具有支持并使用以下命令进行安装:
docker pull datafari/datafari
立即开始,这可能是最好的 按照快速入门指南进行操作。