SPTAG: avoimen lähdekoodin koneoppimisalgoritmi Microsoftilta

sptag

Nykypäivän hakukoneet ovat kehittyneet paljon koska he eivät palvele vain palauttamalla sivuja vain saatuaan yhden tai useamman avainsanan, vaan he yrittävät myös vastata kysymyksiin, ehdottaa asiayhteyksiä jne. Käyttäjillä on jopa mahdollisuus hakea muista kohteista, kuten kuvista.

Tietysti kylläKäyttäjien hakuasetusten seuraaminen ei ole uutta: Se on ollut vaikea taistelu web-haun alusta lähtien.

Mutta nyt on yhä vaikeampaa vastata näihin tarpeisiin jatkuvasti muuttuva tekoälyn kehityksen ansiosta, mukaan lukien Bingin tutkimusryhmän ja Microsoft Research Labin tutkijoiden kehittämät.

"Tekoäly tekee tuotteistamme, joiden kanssa työskentelemme, yhä luonnollisempia", Rangan Majumder sanoi, Konsernin ohjelmapäällikkö Microsoftin Bing Research- ja tekoälytiimille.

Vektorien käyttäminen parempaan hakuun

Los Bingin koneoppimisalgoritmeja käytetään vektoreiden luomiseen, (lähinnä sanan, kuvapikselin tai muun datapisteen digitaalinen esitys). Vektori auttaa sieppaamaan mitä tieto todella tarkoittaa, olipa se sitten teksti verkkosivulla, kuvia, ääntä tai videoita.

Kun numeerinen piste on annettu tiedoille päättäväinen, osaa järjestää tai kartoittaa vektoreita, lähellä olevia numeroita sijoitettu lähelle toisiaan edustamaan samankaltaisuutta. Nämä proksimaaliset tulokset näytetään käyttäjille, mikä parantaa hakutuloksia.

Microsoft alkoi keskittyä tekniikka, johon se perustuu Bing-vektoritutkimus kun yrityksen insinöörit alkoivat havaita epätavallisia malleja käyttäjien hakumalleissa.

"Analysoimalla aikakauslehtiamme tiimi havaitsi, että hakukyselyt pidentyivät ja pidentyivät", Majumder sanoi.

Tämä viittasi siihen, että käyttäjät kysyivät enemmän kysymyksiä, antoivat liian paljon yksityiskohtia aikaisempien tulosten takia, jotka eivät olleet tyydyttäviä avainsanahaulla, tai "yrittivät toimia kuten tietokoneet" kuvattaessa abstrakteja asioita.

Bing Searchin avulla vektorisointi on laajentunut yli 150 miljardiin indeksoituun dataan hakukoneita parantamaan vertailua perinteisiin avainsanoihin.

nämä sisältää yksinkertaisia ​​sanoja, merkkejä, verkkosivujen katkelmia, täydelliset kyselyt ja muut media. Kun käyttäjä suorittaa haun, Bing voi analysoida indeksoidut vektorit ja tarjota parhaan vastaavuuden.

Vektorikartoitus on myös muotoiltu syvähankintatekniikan avulla jatkuvaan parantamiseen.

Mallit ottavat huomioon syötteet, kuten loppukäyttäjän napsautukset haun jälkeen, ymmärtääkseen paremmin tämän haun merkityksen.

Space Partition Tree and Graph julkaistiin avoimena lähdekoodina

Itse asiassa, Microsoft käyttää algoritmia nimeltä Space Partition Tree and Graph (SPTAG). Syöttökysely muunnetaan vektoriksi, ja SPTAG: n avulla löydetään nopeasti "lähimmät naapurit", eli vektorit, jotka ovat samanlaisia ​​kuin tulo.

"Microsoft käyttää vektorihakua omalle Bing-hakukoneelleen, tekniikalle, joka auttaa Bingiä ymmärtämään paremmin miljardien verkkohakujen tarkoitusta ja löytämään osuvimman tuloksen miljardeista verkkosivuista."

Microsoft on asettanut kaikkien saataville avoimen lähdekoodin projektina GitHubissa,

"Yksi kehittyneimmistä ja parhaiten soveltuvista tekoälytyökaluista vastaamaan käyttäjien jatkuvasti muuttuviin hakutarpeisiin."

Keskiviikkona julkaisija lähetti myös näille työkaluille käyttäjätekniikan näytteet ja liitännäisvideon Microsoftin tekoälyn laboratorion kautta.

Bing-tiimi on ilmoittanut toivovansa avoimen lähdekoodin tarjouksen käyttämistä johtavien yritysten tai sovellusten avulla tunnistamaan puhekieli äänikatkelman perusteella tai palveluille, jotka sisältävät monia kuvia, kuten sovellukselle, jonka avulla käyttäjät voivat sovittaa tietoja ja hakuja.

SPTAG-lähdekoodi


Jätä kommentti

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

*

*

  1. Vastaa tiedoista: AB Internet Networks 2008 SL
  2. Tietojen tarkoitus: Roskapostin hallinta, kommenttien hallinta.
  3. Laillistaminen: Suostumuksesi
  4. Tietojen välittäminen: Tietoja ei luovuteta kolmansille osapuolille muutoin kuin lain nojalla.
  5. Tietojen varastointi: Occentus Networks (EU) isännöi tietokantaa
  6. Oikeudet: Voit milloin tahansa rajoittaa, palauttaa ja poistaa tietojasi.