Alexa legge le notizie come un giornalista

Amazon sta usando l’intelligenza artificiale per sviluppare nuovi stili di parlato per Alexa, inclusa una voce da giornalista per leggere articoli

Alexa di Amazon continua a imparare nuovi trucchi e la voce parlante in stile giornalista verrà lanciata sui dispositivi abilitati tra poche settimane.

Puoi ascoltare di seguito i campioni dello stile del parlato e i risultati parlano da soli. La voce non può essere confusa con un umano, ma incorpora l’enfasi nelle frasi nello stesso modo che aspetteresti da un giornalista televisivo o radiofonico.

La tecnologia “Neurale text-to-speech”

Amazon afferma che il nuovo stile è reso possibile dallo sviluppo della tecnologia “neurale text-to-speech” o NTTS; questa è la prossima generazione di sintesi vocale, che usa il machine learning per generare più velocemente voci espressive. Attualmente, Alexa usa la sintesi vocale concatenativa, un metodo che esiste da decenni: ciò comporta la suddivisione degli esempi di parlato in suoni distinti (noti come fonemi) e quindi la concatenazione per formare nuove parole e frasi.

Ecco come si differenziano le voci di Alexa :

Stile concatenativo:

NTTS standard

NTTS in stile newscaster

La sintesi vocale concatenativa può produrre risultati sorprendentemente buoni, ma i nuovi metodi con AI superano rapidamente i limiti precedenti. Lo scorso ottobre, Google ha lanciato una nuova forma di sintesi vocale per l’Assistente Google che utilizza tecniche di machine learning sviluppate dal laboratorio di intelligenza artificiale di Londra DeepMind. Amazon ha affermato che Alexa dovrebbe passare alla sintesi neurale vocale (completa con la voce da giornalista) “nelle prossime settimane”. È plausibile che tale implementazione, però, possa comportare un’attesa maggiore per l’Italia.

La voce da giornalista e l’AI del futuro

La voce da giornalista è stata creata registrando clip audio da canali di notizie reali, utilizzando, poi, il maschile learning per individuare gli schemi nel modo in cui i giornalisti leggono il testo. Amazon ha affermato che questo approccio cattura più facilmente i dettagli negli stili di espressione umana.

In particolare, Amazon sostiene che ci sono volute solo poche ore di dati per insegnare ad Alexa la voce da giornalista, suggerendo che un’intera gamma di stili potrebbe essere facilmente incorporata in futuro. Finora, Amazon ha già aggiunto una modalità sussurrata per Alexa, e dopo l’aggiornamento a NTTS nelle prossime settimane potremo probabilmente aspettarci una serie di nuovi voci che andranno, man mano, ad essere implementate nel corso del 2019.


Alexa legge le notizie come un giornalista - Ultima modifica: 2018-11-25T07:13:59+00:00 da Francesco Marino

Giornalista esperto di tecnologia, da oltre 20 anni si occupa di innovazione, mondo digitale, hardware, software e social. È stato direttore editoriale della rivista scientifica Newton e ha lavorato per 11 anni al Gruppo Sole 24 Ore. È il fondatore e direttore responsabile di Digitalic

Recent Posts

Apple vuole trasformare l’iPhone in un medico virtuale con AI: Project Mulberry

Il progetto con intelligenza artificiale, chiamato Mulberry, è il prossimo tassello dell’ecosistema di benessere di…

2 giorni ago

Meta AI su WhatsApp: il chatbot che ti ascolta, ti risponde… e a volte ti confonde

Meta AI, l’intelligenza artificiale di Zuckerberg, sbarca su WhatsApp tra entusiasmo, sospetti e qualche risata…

2 giorni ago

Addio Blue Screen of Death, Microsoft introduce la schermata nera

Microsoft sostituisce la celebre schermata Blue Screen of Death con una versione nera, più moderna…

2 giorni ago

Aggiornamento iOS 18.4: tutte le novità (e cosa manca ancora in Italia)

Scopri tutte le novità di iOS 18.4, l’aggiornamento che rivoluziona l’esperienza su iPhone con AI,…

1 settimana ago

Batterie Nucleari: la rivoluzione che promette 50 anni di autonomia

Le batterie nucleari innovative promettono 50 anni di autonomia senza ricarica. Scopri come funziona, i…

1 settimana ago

Nuovo generatore di immagini di ChatGPT: la modifica delle foto fa impazzire il Web

Il nuovo generatore di immagini di ChatGPT con la nuova funzione di modifica immagini rivoluziona…

1 settimana ago

Digitalic © MMedia Srl

Via Italia 50, 20900 Monza (MB) - C.F. e Partita IVA: 03339380135

Reg. Trib. Milano n. 409 del 21/7/2011 - ROC n. 21424 del 3/8/2011