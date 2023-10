Après avoir fait parler d’elles aux Grammy Awards, les IA de voice cloning semblent prêtes à remplacer Jay-Z, Drake et The Weeknd. Plongée dans une vague générative qui échappe au droit d’auteur, inquiète l’industrie musicale et soulève des questions morales.

Les fans de Jay-Z ne s’en sont toujours par remis. Si Savages d’AllttA était passé sur un service de streaming musical sans dévoiler sa nature artificielle, ils n’y auraient vu que du feu. Casque aux oreilles, difficile en effet de dire que ce morceau rap flanqué d’un propos social est chanté par une intelligence artificielle imitant à la perfection le célèbre rappeur new-yorkais. Ce titre qui a fait tiquer Young Guru (l’ingé son historique de Jay-Z) s’avance comme le premier de cordée d’une nouvelle vague de créations originales pondues par des producteurs maîtrisant des IA génératives spécialisées en voice cloning. Loin d’être neuf, le phénomène a gagné en qualité et pris une ampleur sans commune mesure ces derniers mois. Jusqu’à secouer l’industrie musicale.



Avant de se rétracter début septembre, Harvey Mason Jr., le patron des Grammy Awards, avait d’abord confirmé l’éligibilité de Heart on My Sleeve de Ghostwriter 977 dans les catégories Best Rap Song et Song of the Year des célèbres prix. Viré de TikTok en avril dernier sous la pression d’Universal Music Group, ce duo fictif entre The Weeknd et Drake constitue un symbole du voice cloning, drainant 15 millions d’écoutes sur le réseau social vidéo. En septembre, le titre poursuivait sa vie sur YouTube en y totalisant 5,8 millions de vues. Sans oublier ses 6,9 millions de clics sur X (ex-Twitter).



La poule aux tubes d’or?

Quoi que l’on puisse croire, cliquer sur une icône et laisser travailler l’IA n’est pas suffisant pour créer une deep fake song. “On peut commencer par sélectionner une quinzaine de chansons d’Étienne Daho pour en extraire sa voix, détaille Bernard Carré, alias Skygge, artiste pop/folk français spécialiste des IA, invité cet été aux conférences de Wallifornia Music Tech de Liège. Il existe aujourd’hui des logiciels bon marché qui le font, comme Lalal.AI. On se retrouve ensuite avec 15 a cappella de Daho qui serviront de base pour entraîner et créer un modèle de sa voix. En pratique, face au micro, on peut donc chanter Week-end à Liège au lieu de Week-end à Rome avec un résultat final qui sonne exactement comme si c’était Daho. Mais il faut savoir très bien imiter sa voix pour avoir un résultat convenable.”

S’apparentant à de l’autotune sous amphétamines, cette approche de speech to speech n’est pas la seule méthode de voice cloning. On évoque également du text to speech lorsqu’il s’agit de taper des paroles sur son PC pour arriver au même résultat. Bien malin qui pourra détailler, à ce jour, la recette la plus populaire. Mais une arborescence d’approches hétéroclites se dessine déjà. Des duos qui n’ont jamais existé (d’artistes vivants et/ou décédés) pointent çà et là. En mai dernier, Timbaland annonçait ainsi travailler avec l’IA vocale de Notorious B.I.G. pour une collaboration sur un titre inédit.

Skygge © National

D’autres se frottent à l’exercice de la reprise fictionnelle. La chaîne YouTube Best AI Songs recense par exemple une soixantaine de morceaux où l’on voit entre autres Michael Jackson interpréter I Believe I Can Fly de R. Kelly ou encore Kurt Cobain s’enticher du Black Hole Sun de Soundgarden. La prolifération de ces covers est logique puisqu’elles permettent de zapper la laborieuse case de l’écriture musicale et textuelle.

Don’t look back in AI

Fatigué d’attendre un nouvel album d’Oasis, Bobby Geraghty et ses potes ont eux écrit et composé AIsis – The Lost Tapes / Vol. 1, un album entier chanté par un Liam Gallagher synthétique. Breezer, leur vrai groupe rock, joue sur cet effort studio lâché en avril dernier. Un bel effort, mais il est certain que face au rock, le rap se profile comme le genre de prédilection du voice cloning. Un prolongement logique puisque, entre sampling, table de mixage et autres autotune, c’est la technologie qui a permis sa naissance et nourri sa croissance.



“On assiste à une démocratisation de l’IA générative dans la musique, ce qui ne va pas arranger la situation financière déjà très compliquée de la plupart des artistes, souligne Sarah Filleur, alias Sarasara, artiste de pop avant- gardiste adepte d’IA. Mais d’un autre côté, on peut imaginer que cette tech de voice cloning va leur permettre de créer un contre-mouvement, un peu comme les samples qui ont engendré la techno.” Et la Française, signée sur One Little Independent, le label de Björk, d’alerter que “tous les gens qui font du mixing et du mastering -qui est un art en soi- vont être éjectés, ce qui est très grave. Ce n’est pas parce qu’on peut faire quelque chose qu’on doit le faire. Ce qui est dangereux avec l’IA, c’est que contrairement à l’énergie nucléaire, elle peut engendrer elle-même d’autres IA. C’est une courbe exponentielle périlleuse.”

En 1998, Cher popularisait pour la première fois l’autotune à grande échelle et ouvrait ainsi une boîte de Pandore qui ne s’est plus refermée depuis. Napster, eMule puis BitTorrent ont ensuite fait chuter l’industrie musicale de son piédestal au début des années 2000. Cette dernière a mis plus de dix ans à s’en remettre à force de streaming. Aujourd’hui, la puissance et surtout l’accessibilité des outils de voice cloning écrit un nouveau chapitre de la saga, qui file un sacré mal de crâne aux majors. D’autant que la démarche est “clean” du point de vue des droits d’auteur. “Tant que c’est un artiste qui produit une création originale et que cette œuvre n’est pas rendue publique comme étant un morceau interprété par Drake par exemple, il n’y a a priori pas de problème, précise Serge Vloeberghs, coordinateur des activités de licence à la Sabam et également présent au Wallifornia Music Tech de Liège. La voix recomposée d’un artiste échappe donc actuellement à toutes les lois du droit d’auteur et des droits voisins. Mais il y a des exceptions. Le bruit que fait le moteur Ferrari, par exemple, est protégé. Si on l’utilise dans d’autres applications, il bénéficie d’un droit de propriété intellectuelle.”

Grimes AI, la voix du turfu

En août dernier, selon un article du Financial Times, Google et Universal Music auraient d’ailleurs négocié un accord sur ces deepfakesaudio portant sur l’octroi de licences pour l’usage de voix et de mélodies d’artistes. En pratique, l’idée serait ici de permettre à tout un chacun de créer légitimement des morceaux en rémunérant les artistes impliqués. Dans la foulée, MyVox embrayait avec une plateforme aidant les artistes à licencier et à monétiser leur propre voix dans des modèles vocaux d’IA. Le tout pour permettre à n’importe qui de créer des morceaux originaux, de les distribuer sur des plateformes de streaming, de collecter des royalties et de partager les revenus avec l’artiste (qui choisit sa propre répartition des revenus).

Transhumaniste convaincue, Grimes a pris les devants de l’exploitation virtuelle et commerciale de sa voix. © Getty Images

Ces deux initiatives suivent en fait un premier pas novateur de Grimes sur ce terrain, en avril dernier. L’artiste canadienne d’électro-pop divergente a en effet autorisé l’usage de sa voix par une IA à condition de recevoir 50% des royalties, en cas de succès majeur. “Après avoir un peu chipoté avec Grimes.AI et Elf.Tech, j’ai eu envie de me lancer, explique Bernard “Skygge” Carré. J’ai d’abord choisi Océan noir (un titre de l’album Melancholia, sorti l’an dernier, NDLR) car je me disais que son ambiance spatiale pouvait bien coller à la voix et à l’univers de Grimes. On envoie ensuite à Grimes le morceau avec sa voix en IA, pour avoir son autorisation. Après avoir signé un petit contrat, il se retrouve publié sur Grimes AI, son profil parallèle sur Spotify.”

La guerre des clones

Ce modèle inauguré par Grimes répond à de nombreuses questions, notamment de propriété intellectuelle, soulevées par le voice cloning. Et si cette vague spontanée n’enfreint pas le droit d’auteur (protéger le timbre d’une voix n’a pas de base légale), en France, utiliser des enregistrements d’un artiste pour entraîner un modèle algorithmique “est considéré comme de la fouille de données, ce qui peut être répréhensible”, note Julien Lefebvre, responsable innovation à la Sacem, l’équivalent français de notre Sabam. Du côté de l’Europe, l’A.I. Act devrait toutefois réguler les intelligences artificielles génératives en forçant notamment des acteurs comme OpenAI à soulever le capot des montagnes de données ayant éduqué ChatGPT. Son adoption devrait arriver d’ici fin 2023 pour une application deux ans plus tard.

“La législation française actuelle penche toutefois sur le principe de l’opt-out dans le domaine de la fouille de données, ce qui veut dire que par défaut, cette dernière est autorisée à moins que l’artiste ne s’y oppose explicitement, poursuit Julien Lefebvre. En clair, si Drake ou The Weeknd avaient par exemple formellement interdit l’usage de leur voix par des IA, ce sera donc répressible. Mais tout ça reste théorique, car en pratique, si un artiste veut s’opposer à l’usage du timbre de sa voix, il n’a quasiment aucun moyen technique de le faire.”

Les artistes en vogue risquent toutefois d’être confrontés à un autre problème: l’usage abusif de leur image. En mai dernier, Vice rapportait ainsi qu’un escroc avait gagné des milliers de dollars en vendant de faux morceaux leakés de Frank Ocean générés par une IA générative. Deux mois plus tard, un sosie de Kanye West avait réussi à organiser une soirée dans un club de Miami en faisant croire au public et au DJ des lieux (!) qu’il venait présenter en avant-première une collaboration avec Drake. L’époque où l’on regardait Hatsune Miku et sa voix synthétique comme une curiosité culturelle tech japonaise est décidément bien révolue…