SPTAG: un algorithme d'apprentissage automatique open source de Microsoft

tag

Les moteurs de recherche d'aujourd'hui ont beaucoup évolué car ils ne sont pas seulement servis en renvoyant simplement les pages après avoir reçu un ou plusieurs mots-clés, mais ils essaient également de répondre aux questions, suggérer des contextes, etc. Les utilisateurs ont même la possibilité de rechercher à partir d'autres éléments, tels que des images.

Bien sûr que ouiSuivre les préférences de recherche des utilisateurs n'est pas nouveau: Cela a été une lutte difficile depuis le début de la recherche sur le Web.

Mais maintenant, il est de plus en plus difficile de répondre à ces besoins en constante évolution, grâce aux progrès de l'intelligence artificielle, y compris ceux développés par l'équipe de recherche Bing et les chercheurs du Microsoft Research Lab.

"L'intelligence artificielle rend les produits avec lesquels nous travaillons de plus en plus naturels", Rangan Majumder a dit, Responsable de programme de groupe pour l'équipe de recherche et d'intelligence artificielle Bing de Microsoft.

Utiliser des vecteurs pour une meilleure recherche

Les Les algorithmes d'apprentissage automatique de Bing sont utilisés pour créer des vecteurs, (essentiellement une représentation numérique d'un mot, d'un pixel d'image ou d'un autre point de données). Un vecteur permet de saisir ce que signifie réellement une donnée, que ce soit du texte sur une page Web, des images, du son ou des vidéos.

Une fois que le point numérique a été attribué à une donnée déterminé, peut organiser ou cartographier des vecteurs, avec des nombres proches placés près les uns des autres pour représenter la similitude. Ces résultats proximaux sont affichés aux utilisateurs, améliorant les résultats de recherche.

Microsoft a commencé à se concentrer sur la technologie sur laquelle il est basé Recherche de vecteurs Bing lorsque les ingénieurs de l'entreprise ont commencé à remarquer des modèles inhabituels dans les modèles de recherche des utilisateurs.

«En analysant nos magazines, l'équipe a constaté que les requêtes de recherche devenaient de plus en plus longues», a déclaré Majumder.

Cela suggérait que les utilisateurs posaient plus de questions, donnaient trop de détails en raison des résultats précédents qui n'étaient pas satisfaisants avec une recherche par mot-clé, ou "essayaient d'agir comme des ordinateurs" lorsqu'ils décrivaient des choses abstraites.

Avec Bing Search, la vectorisation s'est étendue à plus de 150 milliards de données indexées moteurs de recherche pour améliorer la comparaison avec les mots-clés traditionnels.

ces inclure des mots simples, des caractères, des extraits de page Web, des requêtes complètes, etc. médias. Une fois qu'un utilisateur effectue une recherche, Bing peut analyser les vecteurs indexés et fournir la meilleure correspondance.

La cartographie vectorielle est également façonnée en utilisant la technologie d'apprentissage en profondeur pour une amélioration continue.

Les modèles prennent en compte les entrées telles que les clics des utilisateurs finaux après une recherche pour mieux comprendre la signification de cette recherche.

Space Partition Tree and Graph est sorti en open source

en fait, Microsoft utilise un algorithme appelé Space Partition Tree and Graph (SPTAG). Une requête d'entrée est convertie en vecteur et SPTAG est utilisé pour trouver rapidement les «voisins les plus proches», c'est-à-dire des vecteurs similaires à l'entrée.

"Microsoft utilise la recherche vectorielle pour son propre moteur de recherche Bing, une technologie qui aide Bing à mieux comprendre l'intention derrière des milliards de recherches Web et à trouver le résultat le plus pertinent à partir de milliards de pages Web."

Microsoft a mis à disposition de tous, en tant que projet open source sur GitHub,

"L'un des outils d'intelligence artificielle les plus avancés et les mieux adaptés pour répondre aux besoins de recherche en constante évolution des utilisateurs."

Mercredi, l'éditeur a également publié des exemples de techniques utilisateur et une vidéo d'accompagnement pour ces outils via le laboratoire d'intelligence artificielle de Microsoft.

L'équipe Bing a déclaré qu'elle espère que l'offre open source pourra être utilisée par des entreprises ou des applications de premier plan pour identifier une langue parlée sur la base d'un extrait audio, ou pour des services qui incluent de nombreuses images, comme une application qui permet aux utilisateurs de faire correspondre les données et les recherches.

Code source SPTAG


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

*

*

  1. Responsable des données : AB Internet Networks 2008 SL
  2. Finalité des données: Contrôle du SPAM, gestion des commentaires.
  3. Légitimation: votre consentement
  4. Communication des données: Les données ne seront pas communiquées à des tiers sauf obligation légale.
  5. Stockage des données: base de données hébergée par Occentus Networks (EU)
  6. Droits: à tout moment, vous pouvez limiter, récupérer et supprimer vos informations.