SPTAG: un algoritmo di apprendimento automatico open source di Microsoft

sptag

I motori di ricerca di oggi si sono evoluti molto poiché non vengono serviti solo restituendo le pagine dopo aver ricevuto una o più parole chiave, ma cercano anche di rispondere a domande, suggerire contesti, ecc. Gli utenti hanno anche la possibilità di cercare da altri elementi, come le immagini.

Certo che siLe seguenti preferenze di ricerca degli utenti non sono nuove: È stata una lotta difficile dall'inizio della ricerca sul web.

Ma ora è sempre più difficile soddisfare queste esigenze in continua evoluzione, grazie ai progressi nell'intelligenza artificiale, compresi quelli sviluppati dal team di ricerca di Bing e dai ricercatori del Microsoft Research Lab.

"L'intelligenza artificiale rende i prodotti con cui lavoriamo sempre più naturali", Rangan Majumder ha detto, Group Program Manager per il team di ricerca e intelligenza artificiale Bing di Microsoft.

Utilizzo di vettori per una migliore ricerca

I Gli algoritmi di apprendimento automatico di Bing vengono utilizzati per creare vettori, (essenzialmente una rappresentazione digitale di una parola, un pixel dell'immagine o un altro punto dati). Un vettore aiuta a catturare il significato reale di un dato, che si tratti di testo su una pagina web, immagini, suoni o video.

Una volta che il punto numerico è stato assegnato a un dato determinato, può organizzare o mappare i vettori, con numeri vicini posti l'uno vicino all'altro per rappresentare la somiglianza. Questi risultati prossimali vengono visualizzati agli utenti, migliorando i risultati della ricerca.

Microsoft ha iniziato a concentrarsi la tecnologia su cui si basa Ricerca vettoriale Bing quando gli ingegneri dell'azienda hanno iniziato a notare schemi insoliti nei modelli di ricerca degli utenti.

"Analizzando le nostre riviste, il team ha scoperto che le query di ricerca stavano diventando sempre più lunghe", ha detto Majumder.

Ciò ha suggerito che gli utenti facessero più domande, fornendo troppi dettagli a causa di risultati precedenti che non erano soddisfacenti con una ricerca per parola chiave, o "cercando di agire come computer" quando descrivevano cose astratte.

Con Bing Search, la vettorizzazione si è espansa a oltre 150 miliardi di dati indicizzati motori di ricerca per migliorare il confronto con le parole chiave tradizionali.

queste includere parole semplici, caratteri, frammenti di pagine web, query complete e altro media. Una volta che un utente esegue una ricerca, Bing può analizzare i vettori indicizzati e fornire la migliore corrispondenza.

Anche la mappatura vettoriale viene modellata utilizzando la tecnologia di apprendimento profondo per il miglioramento continuo.

I modelli prendono in considerazione input come i clic dell'utente finale dopo una ricerca per comprendere meglio il significato di questa ricerca.

Space Partition Tree and Graph è stato rilasciato come open source

In effetti, Microsoft utilizza un algoritmo chiamato Space Partition Tree and Graph (SPTAG). Una query di input viene convertita in un vettore e SPTAG viene utilizzato per trovare rapidamente i "vicini più vicini", ovvero vettori simili all'input.

"Microsoft utilizza la ricerca vettoriale per il proprio motore di ricerca Bing, una tecnologia che aiuta Bing a comprendere meglio l'intento dietro miliardi di ricerche web e a trovare il risultato più pertinente da miliardi di pagine web".

Microsoft ha messo a disposizione di tutti, come progetto open source su GitHub,

"Uno degli strumenti di intelligenza artificiale più avanzati e più adatti per soddisfare le mutevoli esigenze di ricerca degli utenti".

Mercoledì, l'editore ha anche pubblicato esempi di tecniche utente e un video di accompagnamento per questi strumenti tramite il laboratorio di intelligenza artificiale di Microsoft.

Il team di Bing ha dichiarato di sperare che l'offerta open source possa essere utilizzata da aziende o applicazioni leader per identificare una lingua parlata in base a uno snippet audio o per servizi che includono molte immagini, come un'applicazione che consente agli utenti di abbinare dati e ricerche.

Codice sorgente SPTAG


Lascia un tuo commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati con *

*

*

  1. Responsabile del trattamento: AB Internet Networks 2008 SL
  2. Scopo dei dati: controllo SPAM, gestione commenti.
  3. Legittimazione: il tuo consenso
  4. Comunicazione dei dati: I dati non saranno oggetto di comunicazione a terzi se non per obbligo di legge.
  5. Archiviazione dati: database ospitato da Occentus Networks (UE)
  6. Diritti: in qualsiasi momento puoi limitare, recuperare ed eliminare le tue informazioni.