Scienza e Cultura

L’intelligenza artificiale di Google può individuare voci tra la folla

Una tecnologia decisamente interessante, ma la privacy?

Gli esseri umano sono bravi ad isolare una singola voce nel mezzo della folla, ma il computer? Non tanto!

Basta chiedere a chiunque cerchi di parlare con un oratore intelligente ad una festa in casa. Google potrebbe tuttavia avere una soluzione tanto semplice quanto sorprendente: i ricercatori del colosso della ricerca hanno sviluppato un sistema di apprendimento profondo in gradi di individuare le voci specifiche guardando i volti delle persone quando parlano. Il team di Google, ha addestrato il suo modello di rete neurale per riconoscere le singole persone che parlano da sole, e credo, quindi “parti” virtuali – con tanto di rumore di fondo – per insegnare all’IA come isolare più voci in tracce audio distinte.

I risultati, come potete vedere nel filmato sottostante, sono inquietanti: anche quando le persone stanno chiaramente cercando di competere tra di loro, l’IA è in grado di generare una traccia audio pulita per una persona semplicemente concentrandosi sul volto. Ciò avviene anche se la persona decide di oscurare parzialmente il proprio volti con gesti delle mani o un microfono. Big G sta attualmente esplorando opportunità d’utilizzo per questa funzionalità all’interno dei suoi prodotti, ma tra i primi candidati troviamo i servizi di video chat come Hangouts e Duo, in cui l’intelligenza artificiale potrebbe aiutare a capire chi parla in una stanza affollata.

La tecnologia potrebbe essere utile anche per l’ottimizzazione del parlato nella registrazione video, nonché venire utilizzata con gli apparecchi acustici collegati alla fotocamera che amplificano il suono di chi ti sta di fronte.