Vall-E, l’AI di Microsoft che imita la nostra voce

Vall-E è in grado di produrre un “discorso personalizzato di alta qualità” con nient’altro che una registrazione di tre secondi di qualsiasi persona 

 

 

Nel 2022 siamo stati presi d’assalto dai nuovi strumenti di intelligenza artificiale. Solo per fare alcuni esempi: ChatGPT, Dall-E, Lensa… e il 2023 non sembra essere da meno. In pochi mesi abbiamo scoperto la capacità di queste AI in termini di creatività ed efficienza. Siamo stati sommersi da saggi, opere d’arte e video stranamente convincenti, creati con nient’altro che un input testuale. Ora tocca al sonoro e sul palco, sotto i riflettori, ora c’è Vall-E di Microsoft.

Scopriamo insieme di cosa si tratta.

 

 

Leggi anche: Replika, un’intelligenza artificiale per amica

 

 

Vall-E è un nuovo sistema AI Text To Speech (TTS) che può prendere una registrazione di tre secondi della voce di qualcuno e replicarla, trasformando in un secondo momento il testo in parlato. L’idea non è veramente nuova, ma c’è un elemento spiazzante: la spaventosa bravura di questa intelligenza artificiale nel convincerci che l’output sonoro provenga da un vero essere umano, quando in realtà non è così.

 

 

Ascolta il nostro podcast: La fiducia nelle nuove tecnologie

 

Vall-E
Come funziona Vall-E (Immagine: Microsoft)

 

 

Ma in che modo Vall-E riesce a fare questa magia?
I portavoce di Microsoft hanno affermato che questo strumento utilizza

“un approccio diverso rispetto ad altri generatori di voci che lo hanno preceduto, che lo aiuta a raggiungere una precisione molto più elevata. I dati di addestramento TTS sono stati ridimensionati fino a 60mila ore di parlato in inglese, un numero centinaia di volte più grande dei sistemi esistenti. Ciò consente al sistema TTS di produrre un discorso personalizzato di alta qualità con nient’altro che una registrazione di tre secondi di qualsiasi persona come suggerimento acustico.”

 

 

Ascolta il nostro podcast: Ucraina – Putin, un’intelligenza artificiale sarebbe mai entrata in guerra?

 

 

Gioie e dolori.

Riusciamo a immaginare quanti possibili casi d’uso può avere questo tipo di “colpo teatrale”? Infiniti, alcuni pericolosi (come sempre).

Una storia già raccontata. Infatti, abbiamo già visto deepfake diffondere disinformazione e ispirare complottismi vari, quindi sarà interessante vedere come andranno le cose con Vall-E se e quando sarà reso pubblico.

Una speranza, però, c’è. Pensiamo che potrebbe essere uno strumento per dare la possibilità alle persone che hanno perso l’uso della voce di “farsi sentire” ancora. Pensiamo alla possibilità di parlare con i nostri defunti amici e parenti. Davvero è solo utopia? 

 

Leggi anche: Non c’è ritorno dalla morte… se non sotto forma di avatar

Share on facebook
Share on twitter
Share on linkedin

A cura di

In questo articolo:

Potrebbero interessarti

PODCAST

Politica e Innovazione

Dalla riforma fiscale al ddl a sostegno di startup e PMI innovative

Ospite: Giulio Centemero

OLL IN
con Lelio Borgherese

PODCAST

Cultura e Società

Dalla realtà alla Fantascienza: caffè, tè e altre bevande rituali

CIFcast
con Lorenzo Davia, Damiano Lotto, Emiliano Maramonte

PODCAST

LA privacy degli ultimi
Cybersecurity

Il diritto alla privacy degli ultimi

Ospite: Guido Scorza

A LITTLE PRIVACY, PLEASE!
con Sergio Aracu, Marco Trombadore

PODCAST

Intelligenza artificiale

Verso la creazione di un ecosistema del benessere finanziario con Braino retAIr.me

Ospite: Giulio Massucci

SMASH
con Sabrina Colandrea

PODCAST

Cultura e Società

Il mistero, buffo e tragico, di Ubik

CIFcast
con Lorenzo Davia, Damiano Lotto, Emiliano Maramonte

PODCAST

Digital divide - Intervista alla CEO di Eolo Spa, Daniela Daverio
Trasformazione digitale

Cosa fare per combattere il digital divide?

Ospite: Daniela Daverio

WOW - WOMEN ON WEB
con Federica Meta, Francesca Pucci