Sommaire
La magie de l’intelligence artificielle générative
Dans son livre de 1962, Profiles of the Future: An Inquiry into the Limits of the Possible, l’écrivain de science-fiction Arthur C. Clarke remarquait que « toute technologie suffisamment avancée est indiscernable de la magie ».
Aux débuts des années 80, lorsque les ordinateurs fonctionnaient avec un seul kilo-octet de RAM, tout passionné ayant lu les mots de Clarke aurait regardé les 1 024 octets de RAM disponibles et aurait envisagé un univers de possibilités. Au fur et à mesure que les attentes ont augmenté d’année en année, les utilisateurs lambda de la technologie d’aujourd’hui sont beaucoup moins impressionnables, et encore moins ne ressentent de la magie.
Cependant, il existe de solides raisons pour que même les technologues les plus expérimentés réévaluent presque tout en fonction des innovations actuelles de l’IA. Publié mercredi, l’étonnant Udio produit de la musique à partir de consignes écrites et intègre parfaitement les paroles fournies par l’utilisateur, peu importe leur caractère personnel, frivole ou inapproprié pour le travail.
I found an account on Udio that is mostly generating songs about how his friend Seth shit his pants at work pic.twitter.com/v3jJByMbtq
— abcdent (@abcdentminded) 11 avril 2024
Udio et d’autres plateformes dédiées à l’IA générative sont une forme de magie qui ne peut pas être dévoilée en regardant dans une manche ou en repérant un sosie dans le public. En effet, les complexités qui génèrent cette magie sont impénétrables pour le profane.
Une chose est sûre, cependant; Udio ne s’est pas simplement allumé un jour en disant : « Je sais le Kung Fu (Fighting de Carl Douglas) ». Il a été alimenté en continu par du contenu existant provenant de sources non spécifiées avant de chanter (ou de rapper) une seule note. Si un nouveau projet de loi introduit à la Chambre des représentants des États-Unis gagne du terrain, les créateurs d’Udio devront déclarer chaque chanson sur laquelle Udio a été formé, rétrospectivement.
La loi sur la divulgation des droits d’auteur de l’IA générative
Présenté par le représentant Adam Schiff (D-CA) cette semaine, le projet de loi envisage une « législation révolutionnaire » qui obligerait les entreprises à être totalement transparentes lorsqu’elles forment leurs modèles d’IA générative sur du contenu protégé par le droit d’auteur. Selon le site web de Schiff :
La loi sur la divulgation des droits d’auteur de l’IA générative exigerait qu’un avis soit soumis au registraire des droits d’auteur avant la sortie d’un nouveau système d’IA générative concernant toutes les œuvres protégées par le droit d’auteur utilisées pour élaborer ou modifier l’ensemble de données d’entraînement de ce système. Les exigences de la loi s’appliqueraient également rétroactivement aux systèmes d’IA générative précédemment publiés.
« L’IA a le potentiel perturbateur de changer notre économie, notre système politique et notre vie quotidienne. Nous devons équilibrer l’immense potentiel de l’IA avec le besoin crucial de lignes directrices et de protections éthiques », explique le représentant Schiff.
« Ma loi sur la divulgation des droits d’auteur de l’IA générative constitue une étape cruciale dans cette direction. Elle défend l’innovation tout en protégeant les droits et les contributions des créateurs, en veillant à ce qu’ils soient informés lorsque leur travail contribue aux ensembles de données d’entraînement de l’IA. Il s’agit de respecter la créativité à l’ère de l’IA et de marier le progrès technologique à l’équité. »
Le projet de loi bénéficie d’un large soutien ; la RIAA affirme que la « conservation exhaustive et transparente des archives » est la « base fondamentale » d’une application efficace des droits des créateurs, une position également soutenue par l’ASCAP et, de manière générale, par tous les groupes mentionnés à la fin de cet article.
Étant donné que la Directors Guild of America affirme « féliciter cette législation de bon sens », une perspective de bon sens sur les propositions sera appliquée ici.
Les artistes et les créateurs méritent d’être rémunérés. Point final
Il ne peut y avoir de débat : l’élimination de l’art existant de l’équation de l’IA générative est impossible. Cette dernière ne peut tout simplement pas exister sans la première ; le grand débat juridique semble porter sur la question de savoir si la consommation était protégée par la doctrine de l’utilisation équitable, ou s’il s’agissait tout simplement d’une violation du droit d’auteur.
Si la cour se prononce en faveur de l’utilisation équitable, il semble probable que les titulaires de droits d’auteur ne recevront aucune compensation. Un jugement dans l’autre sens est susceptible de conduire à une rémunération des titulaires de droits d’auteur d’une manière ou d’une autre.
Cependant, bien que les auteurs du projet de loi affirment qu’il « défend l’innovation tout en protégeant les droits et les contributions des créateurs », les seuls bénéficiaires réalistes à long terme seront les titulaires de droits d’auteur ayant un profil suffisamment important pour être identifiés pour un rapport ultérieur.
Dans la plupart des pays développés, les droits d’auteur s’appliquent automatiquement dès que des œuvres créatives sont créées. Cela signifie qu’il pourrait facilement y avoir un milliard de créateurs avec des droits d’auteur valides, bien que non enregistrés, pour des dizaines de milliards d’images, de photos, de vidéos et de pistes musicales disponibles en ligne aujourd’hui.
Le projet de loi prétend agir au nom des créateurs, mais en réalité, il ne peut bénéficier qu’à un sous-ensemble identifiable de créateurs, avec des droits d’auteur enregistrés, dans le but d’une « application efficace des droits des créateurs », selon la RIAA.
Rejoindre la grande équipe ou ne rien obtenir
Tout comme la proposition de « faire exploser Internet » dans le film Four Lions, le projet de loi n’a même pas envisagé ce qui peut et ne peut pas être réalisé. Une base de données centralisée, comprenant toutes les œuvres protégées par le droit d’auteur et leurs propriétaires respectifs, n’existe pas. Même si une équipe de développement d’IA voulait déclarer qu’une certaine œuvre protégée par le droit d’auteur avait été utilisée, comment pourrait-on jamais établir la propriété de ce contenu ?
Et à un moment donné, presque inévitablement, du contenu créé avec des éléments d’autres contenus, autorisé par la doctrine de l’utilisation équitable, sera signalé comme un contenu original protégé par le droit d’auteur, alors qu’aucun paiement pour cette utilisation n’est requis par la loi.
Cela conduit à plusieurs conclusions, toutes fondées sur la manière dont les droits sont actuellement gérés. Au moins au début, si l’on oblige à identifier toutes les œuvres protégées par le droit d’auteur utilisées pour l’Office des droits d’auteur, cela ne sera utile qu’au sous-ensemble de créateurs mentionné précédemment.
À long terme, les créateurs plus petits – qui estiment eux aussi avoir droit à une rémunération – devront probablement rejoindre l’équivalent futur d’un programme Content ID pour l’IA. Gérées par ceux qui ont le pouvoir de mettre en place un tel système, ces entités ont la réputation de faire les règles et de garder la plupart de l’argent.
La conclusion est extrêmement simple : si les créateurs doivent être récompensés pour leur travail, alors tous les créateurs doivent être récompensés pour leur travail. Il ne peut pas y avoir de règles discriminatoires qui valorisent les droits d’un titulaire de droits d’auteur par rapport à ceux d’un autre. Plus fondamentalement, ne proposez pas de législation sans tenir compte du fardeau de la conformité future, puis doublez les difficultés exponentielles associées à la conformité rétroactive, comme le prévoit le projet de loi.
C’est une sorte de magie, mais ce n’est pas de la magie
L’IA peut accomplir des choses magiques, mais ce n’est pas de la magie à proprement parler. Le projet de loi exige des entreprises d’IA qu’elles fournissent un « résumé suffisamment détaillé de toutes les œuvres protégées par le droit d’auteur utilisées dans l’ensemble de données d’entraînement » au Registraire des droits d’auteur, au plus tard 30 jours avant que le système d’IA génératif ne soit mis à la disposition du public. Ou, selon une autre interprétation, suffisamment de temps pour empêcher la mise en œuvre avec une injonction.
Étant donné que cette tâche ne peut tout simplement pas être réalisée pour tous les titulaires de droits d’auteur, dans tous les domaines, la proposition échoue. Une instance de ChatGPT n’a pas rejeté le projet de loi ou ses propositions en bloc lorsqu’elle nous a été présentée aujourd’hui. Cependant, compte tenu de son ensemble de données, et en prévoyant un délai de traitement d’une seconde pour chaque œuvre protégée par le droit d’auteur à identifier en théorie, cela pourrait prendre plus de 31 ans pour terminer cette tâche.
« Ce chiffre fou met en évidence l’immensité de l’échelle et de la complexité de la tâche. Il met en évidence le besoin de solutions innovantes, d’automatisation et de coopération entre les parties prenantes pour relever les défis du droit d’auteur à l’ère de l’IA », conclut l’une des raisons du débat.
Le projet de loi sur la divulgation des droits d’auteur de l’IA générative peut être consulté ici (pdf)
Le projet de loi sur la divulgation des droits d’auteur de l’IA générative est soutenu par la Recording Industry Association of America, le Copyright Clearance Center, la Directors Guild of America, l’Authors Guild, la National Association of Voice Actors, la Concept Art Association, la Professional Photographers of America, la Screen Actors Guild-American Federation of Television and Radio Artists, la Writers Guild of America West, la Writers Guild of America East, l’American Society of Composers, Authors and Publishers, l’American Society for Collective Rights Licensing, l’International Alliance of Theatrical Stage Employees, la Society of Composers and Lyricists, la National Music Publishers Association, la Recording Academy, la Nashville Songwriters Association International, la Songwriters of North America, la Black Music Action Coalition, la Music Artist Coalition, la Human Artistry Campaign et l’American Association of Independent Music.