La intel·ligència artificial està avançant amb passes de gegant. Ja vam veure el desenvolupament avançat d'empreses com OpenAI amb ChatGPT, on Microsoft inverteix grans quantitats de diners. Microsoft està desenvolupant el programari VALL-E que és capaç d'imitar qualsevol veu amb un grau de precisió impressionant.

La idea de Microsoft és que aquest desenvolupament es pugui utilitzar en la creació d'aplicacions de text a veu personalitzades o d'alta qualitat, encara que aquí entra el risc dels deepfake. Per evitar la informació falsa en vídeo i àudio la companyia ha decidit no publicar en obert el codi del seu nou programari perquè no caigui a les mans equivocades.

VALL-E és capaç de sintetitzar la veu de qualsevol persona, el problema és en el mal ús que es pugui fer d'aquesta tecnologia com suplantar la veu d'una persona. Aquest programa s'ha definit com un còdec neuronal per reproduir un model de llenguatge, es basa en la intel·ligència artificial Encodec de Meta, que és capaç de generar veu humana a partir de text.

Per a desenvolupar VALL-E s'han utilitzat enregistraments sonors en anglès realitzades per més de 7.000 persones amb una durada total de 60.000 hores. Algunes de les veus imitades pel programari se senten com si haguessin estat dites per una màquina, però altres són sorprenentment realistes.

Microsoft millorarà els seus serveis amb ajuda de la intel·ligència artificial, però també utilitzarà els models GPT desenvolupats per OpenAI, on ja va invertir alguns milions de dòlars fa uns anys.