Dopo aver sconfitto il campione del mondo del gioco Go, Deepmind ritorna. Questa volta la società britannica ha sviluppato un’intelligenza artificiale in grado di labbra leggere e convertire la voce umana in testo.
Il tasso di accuratezza di questo programma è superiore a quello dei migliori esperti umani. Battezzato LipNet, possiede una precisione del 46,9% nel riconoscere le frasi parlate, contro il 23,8% ottenuto da un professionista consultato come metro di paragone. E, per quanto riguarda il software di riconoscimento delle labbra, che in precedenza lavorava sulle singole parole, ora LipNet va oltre e prevede di leggere intere frasi.
Per imparare a leggere le labbra umano, il software ha ascoltato almeno 5 mila ore di programmi trasmessi dell’emittente BBC.
Messaggi al telefono, trascrizione e duplicazione
Questo programma è stato sviluppato dai ricercatori Deepmind in associazione con gli scienziati dell’Università di Oxford. Nelle conclusioni del loro studio, i ricercatori hanno già trovato le potenziali applicazioni di questa nuova forma di intelligenza artificiale: “Una macchina in grado di leggere le labbra apre la strada a molte applicazioni, come la dettatura delle istruzioni, la dettatura di un messaggio al telefono cellulare in un ambiente rumoroso, la trascrizione e duplicazione senza suoni, la comprensione del parlato quando più persone sono in comunicazione tra loro e, più in generale, si migliorano le prestazioni del riconoscimento vocale“. infine, si potrebbe anche pensare che l’uso di un tale programma potrebbe dare un serio e concreto sostegno alle operazioni eseguite dai servizi segreti.