Parlez après le bip

© Getty Images/iStockphoto

Tour de passe-passe permettant à un algorithme d’apprendre par lui-même, le deep learning dope les intelligences artificielles. Deepfakes défrayait ainsi la chronique le mois dernier. Ce logiciel permettait en effet de remplacer automatiquement -et avec une précision inouïe- le visage d’acteurs porno par celui de célébrités, sur des vidéos explicites. Mais ce jeu de faussaire glauque ne s’arrête pas à l’image. Deep Voice apprend en effet à parler exactement comme la personne qu’elle enregistre, sur base d’un échantillon vocal d’à peine… quatre secondes! Développé par Baidu, mastodonte chinois du Web, ce programme de text to speech explose le chrono de sa précédente version qui demandait une minute de temps de parole, l’an dernier. Face à Adobe qui requérait 20 minutes de voix en 2016 pour réaliser du voice cloning, cette amélioration donne la mesure des progrès exponentiels réalisés par l’apprentissage profond. De quoi propulser les fake news dans une nouvelle dimension, effrayante…

http://research.baidu.com/neural-voice-cloning-samples

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Partner Content