Project VoCo di Adobe: editare la voce come un testo

Adobe ha presentato alla conferenza Adobe MAX – tenutasi a San Diego – il Project VoCo, uno strumento sperimentale che consente di editare il parlato come se si trattasse di un testo, sulla base di un determinato modello vocale.
Ecco come funziona: il Project VoCo richiede circa una ventina di minuti per fornire un campione da un parlato. Analizza il linguaggio, lo frammenta in fonemi, lo trascrive e crea il modello vocale. Ascoltandolo da vicino è possibile distinguere quando sia stata cambiata una parola, ma probabilmente è una questione di tempo prima che si possa non distinguere una registrazione in presa diretta da una completamente simulata.
Come ha fatto notare Adobe nel corso della presentazione della demo, il progetto non si basa sulla tecnologia di sintesi vocale di tipo tradizionale, ma su quella che Adobe stessa definisce come “conversione vocale”.

Ciò che rende questa tecnologia così interessante è che non viene richiesto alcun intervento manuale. È possibile correggere la trascrizione auto-generata per migliorare la sintesi, ma non è necessario che vengano impostate delle marcature temporali, ad esempio. L’algoritmo esegue questo compito autonomamente.
Questo tipo di tecnologia ha suscitato domande di ogni genere, come: che cosa succede nel momento in cui non puoi fidarti di quello che senti, ovvero se non puoi distinguere una registrazione genuina da una artificiale? Insomma, si tratta di una rivoluzione impattante l’immissione di questa tecnologia sul mercato.
Nel corso dello stesso evento Adobe ha mostrato anche due progetti di editing: il Project Quick Layout – che consente di editare i layout di stampa – e il Project Clover, uno strumento di editing per VR che lavora all’interno della realtà virtuale stessa.


Project VoCo di Adobe: editare la voce come un testo - Ultima modifica: 2016-11-06T12:00:53+00:00 da Francesco Marino

Giornalista esperto di tecnologia, da oltre 20 anni si occupa di innovazione, mondo digitale, hardware, software e social. È stato direttore editoriale della rivista scientifica Newton e ha lavorato per 11 anni al Gruppo Sole 24 Ore. È il fondatore e direttore responsabile di Digitalic

Recent Posts

Apple vuole trasformare l’iPhone in un medico virtuale con AI: Project Mulberry

Il progetto con intelligenza artificiale, chiamato Mulberry, è il prossimo tassello dell’ecosistema di benessere di…

3 ore ago

Meta AI su WhatsApp: il chatbot che ti ascolta, ti risponde… e a volte ti confonde

Meta AI, l’intelligenza artificiale di Zuckerberg, sbarca su WhatsApp tra entusiasmo, sospetti e qualche risata…

3 ore ago

Addio Blue Screen of Death, Microsoft introduce la schermata nera

Microsoft sostituisce la celebre schermata Blue Screen of Death con una versione nera, più moderna…

5 ore ago

Aggiornamento iOS 18.4: tutte le novità (e cosa manca ancora in Italia)

Scopri tutte le novità di iOS 18.4, l’aggiornamento che rivoluziona l’esperienza su iPhone con AI,…

6 giorni ago

Batterie Nucleari: la rivoluzione che promette 50 anni di autonomia

Le batterie nucleari innovative promettono 50 anni di autonomia senza ricarica. Scopri come funziona, i…

6 giorni ago

Nuovo generatore di immagini di ChatGPT: la modifica delle foto fa impazzire il Web

Il nuovo generatore di immagini di ChatGPT con la nuova funzione di modifica immagini rivoluziona…

1 settimana ago

Digitalic © MMedia Srl

Via Italia 50, 20900 Monza (MB) - C.F. e Partita IVA: 03339380135

Reg. Trib. Milano n. 409 del 21/7/2011 - ROC n. 21424 del 3/8/2011