Adobe demandait 20 minutes d'échantillon vocal, il y a trois ans, pour faire dire tout et n'importe quoi à un quidam via du text to speech. Aujourd'hui, Deep Voice (du mastodonte chinois Baidu) apprend à...

Adobe demandait 20 minutes d'échantillon vocal, il y a trois ans, pour faire dire tout et n'importe quoi à un quidam via du text to speech. Aujourd'hui, Deep Voice (du mastodonte chinois Baidu) apprend à parler comme la personne qu'elle enregistre en l'écoutant pendant à peine quatre secondes. Ces fulgurants progrès en voice cloning n'ont pas échappé à un groupe de malfaiteurs qui dérobait 220 000 euros en mars dernier, via un simple coup de fil. Reproduisant exactement l'intonation et l'accent du CEO allemand d'une firme (dont le nom n'a pas été divulgué), ces derniers ont dupé le patron d'une compagnie énergétique britannique parente. L'ordre de virer de toute urgence cette somme vers un compte hongrois a été suivi d'une deuxième demande similaire, sans succès cette fois. Ce "voice fishing" utilisait un logiciel de génération vocale en vente dans le commerce. Aux dernières nouvelles, les 220 000 euros ont coulé des jours heureux sur un compte mexicain, entre-temps vidé...