Scienza e Cultura

L’intelligenza artificiale può identificare gli oggetti in base alle descrizioni verbali

Potrebbe portare a traduzioni molto più intelligenti

Intelligenza Artificiale

Il moderno riconoscimento vocale è goffo e spesso richiede enormi quantità di annotazioni e trascrizioni per aiutare a capire a cosa sta facendo riferimento. Tuttavia, potrebbe esserci un modo più naturale: insegnare agli algoritmi d’intelligenza artificiale (AI) a riconoscere cose come si fa con un bambino. Gli scienziati hanno ideato un sistema di apprendimento automatico in grado di identificare gli oggetti in una scena in base alla loro descrizione.

 

Il team ha iniziato con un approccio esistente in cui le reti neurali elaborano le immagini e gli spettrogrammi audio, imparando ad abbinare una didascalia audio con immagini contenenti un determinato oggetto. Tuttavia, hanno modificato la rete neurale di gestione delle immagini in modo tale da suddividere l’immagine in una griglia di celle, mentre la rete auto riduce lo spettrogramma in brevi frammenti da 1-2 secondi. Dopo aver associato l’immagine e la didascalia giuste, il processo di allenamento ottiene il punteggio del sistema AI in base al livello di corrispondenza dei segmenti audio con gli oggetti nelle griglie delle celle. In effetti, è come dire ai bambini cosa stanno guardando, indicando gli oggetti e nominandoli.

 

 

Esistono numerosi potenziali usi, ma i ricercatori sono particolarmente interessati al potenziale per la traduzione. Piuttosto che chiedere a un commentatore bilingue di effettuare dei collegamenti, potresti avere persone che parlano lingue diverse descrivere la medesima cosa: il problema potrebbe supporre che una descrizione sia una traduzione dell’altro. Ciò potrebbe rendere il riconoscimento vocale praticabile per molte più lingue rispetto alle 100 circa che utilizzano il metodo vecchio stile.