Comment le voice cloning s’apprête à bouleverser l’industrie musicale?

Derrière Heart on My Sleeve, duo virtuel entre Drake et The Weeknd, se cache toujours le producteur magicien de l'IA Ghostwriter 977. © dr

Michi-Hiro Tamaï Journaliste multimédia

Journaliste multimédia 07-10-2023, 10:05 Mise à jour le: 11-10-2023, 07:33 Du 05/10/2023 du Focus Vif

Après avoir fait parler d’elles aux Grammy Awards, les IA de voice cloning semblent prêtes à remplacer Jay-Z, Drake et The Weeknd. Plongée dans une vague générative qui échappe au droit d’auteur, inquiète l’industrie musicale et soulève des questions morales.

Les fans de Jay-Z ne s’en sont toujours par remis. Si Savages d’AllttA était passé sur un service de streaming musical sans dévoiler sa nature artificielle, ils n’y auraient vu que du feu. Casque aux oreilles, difficile en effet de dire que ce morceau rap flanqué d’un propos social est chanté par une intelligence artificielle imitant à la perfection le célèbre rappeur new-yorkais. Ce titre qui a fait tiquer Young Guru (l’ingé son historique de Jay-Z) s’avance comme le premier de cordée d’une nouvelle vague de créations originales pondues par des producteurs maîtrisant des IA génératives spécialisées en voice cloning. Loin d’être neuf, le phénomène a gagné en qualité et pris une ampleur sans commune mesure ces derniers mois. Jusqu’à secouer l’industrie musicale.

L’affichage de ce contenu a été bloqué pour respecter vos choix en matière de cookies. Cliquez ici pour régler vos préférences en matière de cookies et afficher le contenu.
Vous pouvez modifier vos choix à tout moment en cliquant sur « Paramètres des cookies » en bas du site.

Avant de se rétracter début septembre, Harvey Mason Jr., le patron des Grammy Awards, avait d’abord confirmé l’éligibilité de Heart on My Sleeve de Ghostwriter 977 dans les catégories Best Rap Song et Song of the Year des célèbres prix. Viré de TikTok en avril dernier sous la pression d’Universal Music Group, ce duo fictif entre The Weeknd et Drake constitue un symbole du voice cloning, drainant 15 millions d’écoutes sur le réseau social vidéo. En septembre, le titre poursuivait sa vie sur YouTube en y totalisant 5,8 millions de vues. Sans oublier ses 6,9 millions de clics sur X (ex-Twitter).

https://www.youtube.com/watch?v=6FapwxsbkLs&ab_channel=ghostwriter

La poule aux tubes d’or?

Quoi que l’on puisse croire, cliquer sur une icône et laisser travailler l’IA n’est pas suffisant pour créer une deep fake song. “On peut commencer par sélectionner une quinzaine de chansons d’Étienne Daho pour en extraire sa voix, détaille Bernard Carré, alias Skygge, artiste pop/folk français spécialiste des IA, invité cet été aux conférences de Wallifornia Music Tech de Liège. Il existe aujourd’hui des logiciels bon marché qui le font, comme Lalal.AI. On se retrouve ensuite avec 15 a cappella de Daho qui serviront de base pour entraîner et créer un modèle de sa voix. En pratique, face au micro, on peut donc chanter Week-end à Liège au lieu de Week-end à Rome avec un résultat final qui sonne exactement comme si c’était Daho. Mais il faut savoir très bien imiter sa voix pour avoir un résultat convenable.”

S’apparentant à de l’autotune sous amphétamines, cette approche de speech to speech n’est pas la seule méthode de voice cloning. On évoque également du text to speech lorsqu’il s’agit de taper des paroles sur son PC pour arriver au même résultat. Bien malin qui pourra détailler, à ce jour, la recette la plus populaire. Mais une arborescence d’approches hétéroclites se dessine déjà. Des duos qui n’ont jamais existé (d’artistes vivants et/ou décédés) pointent çà et là. En mai dernier, Timbaland annonçait ainsi travailler avec l’IA vocale de Notorious B.I.G. pour une collaboration sur un titre inédit.

D’autres se frottent à l’exercice de la reprise fictionnelle. La chaîne YouTube Best AI Songs recense par exemple une soixantaine de morceaux où l’on voit entre autres Michael Jackson interpréter I Believe I Can Fly de R. Kelly ou encore Kurt Cobain s’enticher du Black Hole Sun de Soundgarden. La prolifération de ces covers est logique puisqu’elles permettent de zapper la laborieuse case de l’écriture musicale et textuelle.

Don’t look back in AI

Fatigué d’attendre un nouvel album d’Oasis, Bobby Geraghty et ses potes ont eux écrit et composé AIsis – The Lost Tapes / Vol. 1, un album entier chanté par un Liam Gallagher synthétique. Breezer, leur vrai groupe rock, joue sur cet effort studio lâché en avril dernier. Un bel effort, mais il est certain que face au rock, le rap se profile comme le genre de prédilection du voice cloning. Un prolongement logique puisque, entre sampling, table de mixage et autres autotune, c’est la technologie qui a permis sa naissance et nourri sa croissance.

L’affichage de ce contenu a été bloqué pour respecter vos choix en matière de cookies. Cliquez ici pour régler vos préférences en matière de cookies et afficher le contenu.
Vous pouvez modifier vos choix à tout moment en cliquant sur « Paramètres des cookies » en bas du site.

“On assiste à une démocratisation de l’IA générative dans la musique, ce qui ne va pas arranger la situation financière déjà très compliquée de la plupart des artistes, souligne Sarah Filleur, alias Sarasara, artiste de pop avant- gardiste adepte d’IA. Mais d’un autre côté, on peut imaginer que cette tech de voice cloning va leur permettre de créer un contre-mouvement, un peu comme les samples qui ont engendré la techno.” Et la Française, signée sur One Little Independent, le label de Björk, d’alerter que “tous les gens qui font du mixing et du mastering -qui est un art en soi- vont être éjectés, ce qui est très grave. Ce n’est pas parce qu’on peut faire quelque chose qu’on doit le faire. Ce qui est dangereux avec l’IA, c’est que contrairement à l’énergie nucléaire, elle peut engendrer elle-même d’autres IA. C’est une courbe exponentielle périlleuse.”

En 1998, Cher popularisait pour la première fois l’autotune à grande échelle et ouvrait ainsi une boîte de Pandore qui ne s’est plus refermée depuis. Napster, eMule puis BitTorrent ont ensuite fait chuter l’industrie musicale de son piédestal au début des années 2000. Cette dernière a mis plus de dix ans à s’en remettre à force de streaming. Aujourd’hui, la puissance et surtout l’accessibilité des outils de voice cloning écrit un nouveau chapitre de la saga, qui file un sacré mal de crâne aux majors. D’autant que la démarche est “clean” du point de vue des droits d’auteur. “Tant que c’est un artiste qui produit une création originale et que cette œuvre n’est pas rendue publique comme étant un morceau interprété par Drake par exemple, il n’y a a priori pas de problème, précise Serge Vloeberghs, coordinateur des activités de licence à la Sabam et également présent au Wallifornia Music Tech de Liège. La voix recomposée d’un artiste échappe donc actuellement à toutes les lois du droit d’auteur et des droits voisins. Mais il y a des exceptions. Le bruit que fait le moteur Ferrari, par exemple, est protégé. Si on l’utilise dans d’autres applications, il bénéficie d’un droit de propriété intellectuelle.”

Grimes AI, la voix du turfu

En août dernier, selon un article du Financial Times, Google et Universal Music auraient d’ailleurs négocié un accord sur ces deepfakesaudio portant sur l’octroi de licences pour l’usage de voix et de mélodies d’artistes. En pratique, l’idée serait ici de permettre à tout un chacun de créer légitimement des morceaux en rémunérant les artistes impliqués. Dans la foulée, MyVox embrayait avec une plateforme aidant les artistes à licencier et à monétiser leur propre voix dans des modèles vocaux d’IA. Le tout pour permettre à n’importe qui de créer des morceaux originaux, de les distribuer sur des plateformes de streaming, de collecter des royalties et de partager les revenus avec l’artiste (qui choisit sa propre répartition des revenus).

Transhumaniste convaincue, Grimes a pris les devants de l'exploitation virtuelle et commerciale de sa voix. — Transhumaniste convaincue, Grimes a pris les devants de l’exploitation virtuelle et commerciale de sa voix. © Getty Images

Ces deux initiatives suivent en fait un premier pas novateur de Grimes sur ce terrain, en avril dernier. L’artiste canadienne d’électro-pop divergente a en effet autorisé l’usage de sa voix par une IA à condition de recevoir 50% des royalties, en cas de succès majeur. “Après avoir un peu chipoté avec Grimes.AI et Elf.Tech, j’ai eu envie de me lancer, explique Bernard “Skygge” Carré. J’ai d’abord choisi Océan noir (un titre de l’album Melancholia, sorti l’an dernier, NDLR) car je me disais que son ambiance spatiale pouvait bien coller à la voix et à l’univers de Grimes. On envoie ensuite à Grimes le morceau avec sa voix en IA, pour avoir son autorisation. Après avoir signé un petit contrat, il se retrouve publié sur Grimes AI, son profil parallèle sur Spotify.”

La guerre des clones

Ce modèle inauguré par Grimes répond à de nombreuses questions, notamment de propriété intellectuelle, soulevées par le voice cloning. Et si cette vague spontanée n’enfreint pas le droit d’auteur (protéger le timbre d’une voix n’a pas de base légale), en France, utiliser des enregistrements d’un artiste pour entraîner un modèle algorithmique “est considéré comme de la fouille de données, ce qui peut être répréhensible”, note Julien Lefebvre, responsable innovation à la Sacem, l’équivalent français de notre Sabam. Du côté de l’Europe, l’A.I. Act devrait toutefois réguler les intelligences artificielles génératives en forçant notamment des acteurs comme OpenAI à soulever le capot des montagnes de données ayant éduqué ChatGPT. Son adoption devrait arriver d’ici fin 2023 pour une application deux ans plus tard.

“La législation française actuelle penche toutefois sur le principe de l’opt-out dans le domaine de la fouille de données, ce qui veut dire que par défaut, cette dernière est autorisée à moins que l’artiste ne s’y oppose explicitement, poursuit Julien Lefebvre. En clair, si Drake ou The Weeknd avaient par exemple formellement interdit l’usage de leur voix par des IA, ce sera donc répressible. Mais tout ça reste théorique, car en pratique, si un artiste veut s’opposer à l’usage du timbre de sa voix, il n’a quasiment aucun moyen technique de le faire.”

Les artistes en vogue risquent toutefois d’être confrontés à un autre problème: l’usage abusif de leur image. En mai dernier, Vice rapportait ainsi qu’un escroc avait gagné des milliers de dollars en vendant de faux morceaux leakés de Frank Ocean générés par une IA générative. Deux mois plus tard, un sosie de Kanye West avait réussi à organiser une soirée dans un club de Miami en faisant croire au public et au DJ des lieux (!) qu’il venait présenter en avant-première une collaboration avec Drake. L’époque où l’on regardait Hatsune Miku et sa voix synthétique comme une curiosité culturelle tech japonaise est décidément bien révolue…

Quatre exemples bluffants de voice cloning

Savages – AllttA (Jay-Z AI et Mr. Jay Medeiros)

Avec un propos social évoquant la résilience face à la pauvreté, Savages convoque des samples de violons très cinématographiques au fil d’une vibe qui rappelle les meilleures heures de A Tribe Called Quest. Derrière cette claque, AllttA se profile comme un duo castant l’Américain Mr. J. Medeiros et le français 20syl. Tous les deux ont passé une vingtaine de semaines à tweaker et à nettoyer ce morceau. S’il ne fallait retenir qu’un morceau de voice cloning, ce serait celui-là.

Winter’s Cold – LVCCI (Drake AI)

La voix de Drake fait l’objet d’une foule de deepfake audio. Mais entre paranoïa, plage, célébrité et femmes, Winter’s Cold s’en démarque avec des paroles capturant parfaitement son univers. Rappeur libanais basé à Dubaï, LVCCI (dites “Lucci”) officie derrière ce projet au refrain entêtant. Ce dernier a utilisé une base de données de 200 000 échantillons de la voix du rappeur pour mener ce projet à bien. Encensé par des critiques rap, LVCCI détaille sa démarche dans un épisode éclairant du David Paykin Podcast.

Heart on My Sleeve – Ghoswriter 977 (The Weeknd AI & Drake AI)

Emblème médiatique de la génération voice cloning,Heart on My Sleeve a poussé Universal à évoquer officiellement une “contrefaçon” et une “fraude”. Billboard, le New York Times, Vice et The Verge enquêtes sur l’identité de Ghoswriter 977, son compositeur, soupçonné d’être un parolier de grandes stars. Malgré la qualité vocale boiteuse du binôme, les paroles assurent en évoquant la rupture d’Abel Makkonen Tesfaye, alias The Weeknd, et de Selena Gomez.

Out of My Mind – Breezer (Liam Gallagher AI)

Actif depuis dix ans, Breezer, tribute band d’Oasis, est passé à la vitesse supérieure grâce au voice clonning. Ce groupe qui organise de vrais concerts -notamment à Londres le 10 juin dernier- synthétise Liam Gallagher avec un certain talent sur Out of My Mind. Pas de quoi crier au génie bien sûr. Mais le titre brille plus que certains vrais morceaux de High Flying Birds, le band de Noel Gallagher, qui alignait des variations ronflantes de Don’t Look Back in Anger.

Lire plus de:

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Comment le voice cloning s’apprête à bouleverser l’industrie musicale?

La poule aux tubes d’or?

Don’t look back in AI

Grimes AI, la voix du turfu

La guerre des clones

Partner Content

A la une

Focus

Rubriques

Dossiers

Focus F@ctory

Partners

Parce qu’il y a autant de personnes que d’opinions