Inhaltsverzeichnis
L’intelligence artificielle et le droit d’auteur : des questions intéressantes
L’intelligence artificielle a le potentiel de rendre nos vies plus efficaces, divertissantes et productives. Cependant, il y a aussi des inconvénients potentiels.
D’un point de vue du droit d’auteur, l’IA soulève des questions intéressantes. Par exemple, est-ce que le contenu créé par une IA peut être protégé par le droit d’auteur ? Et est-ce qu’une IA peut être entraînée sur des œuvres protégées par le droit d’auteur sans limitation ?
Des auteurs poursuivent OpenAI en justice
Plusieurs auteurs estiment que les ensembles de données d’entraînement de grands modèles de langage ne devraient pas être autorisés à utiliser tous les textes qu’ils trouvent en ligne. Dans leur poursuite déposée en juin, les auteurs de livres Paul Tremblay et Mona Awad ont accusé OpenAI de violation directe et indirecte du droit d’auteur, entre autres.
Peu de temps après, l’écrivaine/comédienne Sarah Silverman a été rejointe par les auteurs Christopher Golden et Richard Kadrey dans une poursuite identique qui accusait également OpenAI d’utiliser des livres comme données d’entraînement. Selon la plainte, cela s’est fait sans autorisation, en utilisant des ensembles de données provenant de sites pirates.
Les plaintes mentionnent les ensembles de données controversés Books2 et Books3, qui seraient issus de bibliothèques clandestines telles que LibGen, Z-Library, Sci-Hub et Bibliotik.
« Les livres agrégés par ces sites sont également disponibles en vrac via des systèmes de torrents. Ces bibliothèques clandestines flagrantes et illégales ont depuis longtemps suscité l’intérêt de la communauté de l’IA… », ont écrit les auteurs.
OpenAI demande au tribunal de rejeter les accusations
Cette semaine, OpenAI a répondu à ces accusations en demandant le rejet de la majeure partie des plaintes. Celles-ci incluent les accusations de violation indirecte du droit d’auteur, de violation du DMCA, de concurrence déloyale, de « négligence » et d’enrichissement injuste.
« Aucun de ces motifs d’action ne constitue une demande viable, car aucune des théories juridiques contestées ici ne condamne réellement le comportement allégué concernant ChatGPT, les modèles de langage qui le sous-tendent, ou le processus utilisé pour les créer », a informé OpenAI au tribunal.
« Il est important que ces demandes soient rejetées dès le départ, afin que ces affaires ne passent pas à la phase de découverte et au-delà avec des théories de responsabilité juridiquement infirmes. »
La seule plainte qui devrait survivre, pour l’instant, est celle de la violation directe du droit d’auteur, mais OpenAI s’attend à rejeter cette plainte ultérieurement.
Usage équitable
Les accusations de violation du droit d’auteur formulées par les auteurs sont fondées sur le droit d’auteur. OpenAI ne conteste pas que le droit d’auteur joue un rôle, mais note que les plaintes adoptent une position rigide, passant sous silence des exceptions telles que l’usage équitable.
« Cependant, ces revendications méconnaissent la portée du droit d’auteur, ne tenant pas compte des limitations et des exceptions (notamment l’usage équitable) qui laissent correctement place à des innovations telles que les grands modèles de langage qui sont maintenant à l’avant-garde de l’intelligence artificielle », souligne OpenAI.
OpenAI fait remarquer que lors de la rédaction de la Constitution des États-Unis, ses créateurs considéraient le droit d’auteur comme un outil pour promouvoir le progrès des sciences et des arts utiles. Dans ce cas, l’IA est considérée comme un progrès utile, et son utilisation de grandes quantités de textes protégés par le droit d’auteur pourrait être considérée comme « équitable ».
« De nombreux tribunaux ont appliqué la doctrine de l’usage équitable pour trouver un équilibre, reconnaissant que l’utilisation de matériaux protégés par le droit d’auteur par des innovateurs de manière transformative ne viole pas le droit d’auteur », écrit OpenAI.
Dérivé ?
Les auteurs ont clairement une opinion différente. Ils soutiennent que chaque sortie des modèles de langage d’OpenAI est une œuvre dérivée violant le droit d’auteur. Ces dérivés sont générés sans obtenir l’autorisation des détenteurs des droits.
OpenAI soutient que cette conclusion va trop loin. L’organisation souligne, sur la base de la théorie des auteurs, que toutes les sorties des grands modèles de langage sont essentiellement des violations du droit d’auteur. Bien que cela puisse être ce que les auteurs souhaitent, cela entraverait considérablement les innovations de l’IA.
Les tribunaux ont déjà rejeté des interprétations du terme « dérivé » qui étaient trop larges, et devraient le faire également ici, note la société d’IA.
« Selon les plaintes, chaque sortie de ChatGPT – d’une simple réponse à une question, au nom du président des États-Unis, à un paragraphe décrivant l’intrigue, les thèmes et l’importance de l’Iliade d’Homère – est nécessairement une « œuvre dérivée » violant les livres des plaignants.
« Pire encore, chacune de ces sorties serait simultanément une œuvre dérivée violant chacune des millions d’autres œuvres individuelles contenues dans le corpus d’entraînement, indépendamment de toute similitude entre la sortie et les œuvres d’entraînement. Ce n’est pas ainsi que fonctionne le droit d’auteur », ajoute OpenAI.
Sur la base de ces arguments, OpenAI demande au tribunal de rejeter toutes les accusations, à l’exception de la violation directe du droit d’auteur.
Les auteurs doivent encore répondre, mais ils sont susceptibles de contester la requête d’OpenAI. Ces affaires contribueront à définir les limites du droit d’auteur en ce qui concerne les développements de l’IA, et seront probablement l’objet d’une lutte acharnée.
-
Les requêtes de rejet dans l’affaire Tremblay et Awad sont disponibles ici (pdf), et la version identique déposée dans la poursuite Silverman, Golden, Kadrey est disponible ici (pdf).