SPTAG: en algoritm för öppen källkod för maskininlärning från Microsoft

sptag

Dagens sökmotorer har utvecklats mycket eftersom de inte bara serveras genom att bara returnera sidorna efter att ha fått ett eller flera nyckelord, utan de försöker också svara på frågor, föreslå sammanhang etc. Användare har till och med möjligheten att söka från andra objekt, till exempel bilder.

Såklart jaFöljande användares sökinställningar är inte nya: Det har varit en svår kamp sedan webbsökningen startade.

Men nu blir det allt svårare att möta dessa behov ständigt föränderliga tack vare framsteg inom artificiell intelligens, inklusive de som utvecklats av forskargruppen Bing och forskare i Microsoft Research Lab.

"Artificiell intelligens gör de produkter vi arbetar med mer och mer naturliga", Rangan Majumder sa, Gruppprogramchef för Microsofts team för Bing Research and Artificial Intelligence.

Använda vektorer för en bättre sökning

mycket Bings maskininlärningsalgoritmer används för att skapa vektorer, (i huvudsak en digital representation av ett ord, bildpixel eller annan datapunkt). En vektor hjälper till att fånga vad en bit data verkligen betyder, vare sig det är text på en webbsida, bilder, ljud eller videor.

När den numeriska punkten har tilldelats en data fast besluten, kan organisera eller kartlägga vektorer, med nära siffror placerade nära varandra för att representera likhet. Dessa proximala resultat visas för användarna, vilket förbättrar sökresultaten.

Microsoft började fokusera på den teknik som den bygger på Bing vektorforskning när företagets ingenjörer började märka ovanliga mönster i användarnas sökmönster.

"Genom att analysera våra tidskrifter fann teamet att sökfrågorna blev längre och längre," sa Majumder.

Detta föreslog att användarna ställde fler frågor, gav för mycket detaljer på grund av tidigare resultat som inte var tillfredsställande med en nyckelordssökning, eller "försökte agera som datorer" när de beskriver abstrakta saker.

Med Bing Search har vektoriseringen expanderat till mer än 150 miljarder indexerade data sökmotorer för att förbättra jämförelsen med traditionella nyckelord.

Dessa inkludera enkla ord, tecken, webbsidesutdrag, fullständiga frågor och andra media. När en användare har gjort en sökning kan Bing analysera de indexerade vektorerna och ge den bästa matchningen.

Vektormappning formas också med djupinlärningsteknik för kontinuerlig förbättring.

Modeller tar hänsyn till ingångar som slutanvändarklick efter en sökning för att bättre förstå innebörden av denna sökning.

Space Partition Tree och Graph släpptes som öppen källkod

Faktum är faktiskt, Microsoft använder en algoritm som heter Space Partition Tree and Graph (SPTAG). En inmatningsfråga konverteras till en vektor och SPTAG används för att snabbt hitta "närmaste grannar", det vill säga vektorer som liknar ingången.

"Microsoft använder vektorsökning för sin egen Bing-sökmotor, en teknik som hjälper Bing att bättre förstå avsikten bakom miljarder webbsökningar och hitta det mest relevanta resultatet från miljarder webbsidor."

Microsoft har gjort tillgängligt för alla som ett open source-projekt på GitHub,

"Ett av de mest avancerade och bäst lämpade verktygen för artificiell intelligens för att möta användarnas ständigt föränderliga sökbehov."

På onsdagen publicerade utgivaren också användarteknikprover och en kompletterande video för dessa verktyg via Microsofts artificiella intelligenslaboratorium.

Bing-teamet har uppgett att de hoppas att open source-erbjudandet kan användas av stora företag eller applikationer för att identifiera ett talat språk baserat på ett ljudavsnitt, eller för tjänster som innehåller många bilder, till exempel ett program som låter användare matcha data och sökningar.

SPTAG-källkod


Lämna din kommentar

Din e-postadress kommer inte att publiceras. Obligatoriska fält är markerade med *

*

*

  1. Ansvarig för data: AB Internet Networks 2008 SL
  2. Syftet med uppgifterna: Kontrollera skräppost, kommentarhantering.
  3. Legitimering: Ditt samtycke
  4. Kommunikation av uppgifterna: Uppgifterna kommer inte att kommuniceras till tredje part förutom enligt laglig skyldighet.
  5. Datalagring: databas värd för Occentus Networks (EU)
  6. Rättigheter: När som helst kan du begränsa, återställa och radera din information.