Adobe ha presentato alla conferenza Adobe MAX – tenutasi a San Diego – il Project VoCo, uno strumento sperimentale che consente di editare il parlato come se si trattasse di un testo, sulla base di un determinato modello vocale.
Ecco come funziona: il Project VoCo richiede circa una ventina di minuti per fornire un campione da un parlato. Analizza il linguaggio, lo frammenta in fonemi, lo trascrive e crea il modello vocale. Ascoltandolo da vicino è possibile distinguere quando sia stata cambiata una parola, ma probabilmente è una questione di tempo prima che si possa non distinguere una registrazione in presa diretta da una completamente simulata.
Come ha fatto notare Adobe nel corso della presentazione della demo, il progetto non si basa sulla tecnologia di sintesi vocale di tipo tradizionale, ma su quella che Adobe stessa definisce come “conversione vocale”.
Ciò che rende questa tecnologia così interessante è che non viene richiesto alcun intervento manuale. È possibile correggere la trascrizione auto-generata per migliorare la sintesi, ma non è necessario che vengano impostate delle marcature temporali, ad esempio. L’algoritmo esegue questo compito autonomamente.
Questo tipo di tecnologia ha suscitato domande di ogni genere, come: che cosa succede nel momento in cui non puoi fidarti di quello che senti, ovvero se non puoi distinguere una registrazione genuina da una artificiale? Insomma, si tratta di una rivoluzione impattante l’immissione di questa tecnologia sul mercato.
Nel corso dello stesso evento Adobe ha mostrato anche due progetti di editing: il Project Quick Layout – che consente di editare i layout di stampa – e il Project Clover, uno strumento di editing per VR che lavora all’interno della realtà virtuale stessa.
I Podcast hanno conquistato l'Italia, qui la lista dei migliori Podcaster Italiani in base al…
Le due startup italiane SWITCH e Wayla raccolgono fondi per rivoluzionare il trasporto urbano con…
Il report di NTT DATA esplora il divario tra innovazione AI e responsabilità, evidenziando l'importanza…
Microsoft ha presentato il Majorana 1, un chip quantistico topologico che punta a risolvere problemi…
L’intelligenza artificiale può simulare, comprendere e suscitare emozioni, creando un dialogo emotivo che richiede consapevolezza.…
Meta AI ha sviluppato una tecnologia per decodificare l'attività cerebrale in testo tramite reti neurali…
Via Italia 50, 20900 Monza (MB) - C.F. e Partita IVA: 03339380135
Reg. Trib. Milano n. 409 del 21/7/2011 - ROC n. 21424 del 3/8/2011