SPTAG:Microsoft提供的开源机器学习算法

标签

当今的搜索引擎已经发展了很多 因为它们不仅可以在收到一个或多个关键字后返回页面,而且还可以尝试回答问题,建议上下文等。 用户甚至可以从其他项目(例如图像)中进行搜索。

当然可以遵循用户的搜索首选项不是新的: 自从开始进行网络搜索以来,这一直是一场艰苦的斗争。

但是现在,满足这些需求变得越来越困难 不断变化,这要归功于人工智能的进步,包括Bing研究团队和Microsoft研究实验室的研究人员开发的人工智能。

“人工智能使我们使用的产品越来越自然”, 兰甘·马朱德(Rangan Majumder)说, 微软Bing研究和人工智能团队的小组项目经理。

使用向量进行更好的搜索

MGI Bing的机器学习算法用于创建向量,(基本上是单词,图像像素或其他数据点的数字表示)。 一个向量 帮助捕获数据的真正含义,无论是网页上的文字,图片,声音还是视频。

将数字点分配给数据后 决定, 可以组织或映射载体,并以彼此靠近的接近数字表示相似性。 将这些近端结果显示给用户,从而改善搜索结果。

微软开始专注于 它所基于的技术 必应向量研究 当公司的工程师开始注意到用户搜索模式中的异常模式时。

“通过分析我们的杂志,该团队发现搜索查询越来越长,” Majumder说。

这表明用户提出了更多的问题,由于先前的结果无法通过关键字搜索获得足够的详细信息,或者在描述抽象事物时“试图像计算机一样工作”。

借助Bing Search,矢量化已扩展到超过150亿个索引数据 搜索引擎,以提高与传统关键字的比较。

这些 包括简单的单词,字符,网页摘要,完整查询等 媒体。 用户执行搜索后,Bing可以分析索引的向量并提供最佳匹配。

还使用深度学习技术来塑造矢量映射,以实现持续改进。

模型会考虑输入,例如搜索后的最终用户点击次数,以更好地理解此搜索的含义。

空间分区树和图作为开源发布

实际上,Microsoft使用一种称为“空间分区树和图”的算法 (SPTAG)。 将输入查询转换为向量,并使用SPTAG快速查找“最近邻居”,即与输入相似的向量。

“微软将向量搜索用于其自己的Bing搜索引擎,该技术可以帮助Bing更好地了解数十亿次网络搜索的意图,并从数十亿个网页中找到最相关的结果。”

微软 已作为所有人在GitHub上的开源项目向所有人开放,

“最先进,最适合的人工智能工具之一,可以满足用户不断变化的搜索需求。”

周三,出版商还通过微软的人工智能实验室发布了用户技术样本以及这些工具的配套视频。

Bing团队表示,他们希望可以使用开源产品 主要公司或应用程序根据音频片段来识别口头语言,或者用于包含许多图像的服务,例如允许用户匹配数据和搜索的应用程序。

SPTAG源代码


发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责资料:AB Internet Networks 2008 SL
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。