Inhaltsverzeichnis
Plaintes contre NVIDIA pour violation du droit d’auteur
Plusieurs auteurs ont intenté une action collective en violation du droit d’auteur contre le géant de la technologie NVIDIA, qui est à la tête de la révolution de l’IA. En plus de vendre du matériel et des services, NVIDIA possède ses propres modèles de langage. Les auteurs affirment que les modèles d’IA ont été entraînés sur des œuvres protégées par le droit d’auteur provenant du site « pirate » Bibliotik, et qu’ils ont donc droit à une compensation.
Des plaintes contre les sociétés de technologie
Depuis l’année dernière, divers détenteurs de droits d’auteur ont intenté des poursuites contre des entreprises qui développent des modèles d’IA.
La liste des plaignants comprend des maisons de disques, des auteurs de livres, des artistes visuels, et même le New York Times. Ces détenteurs de droits d’auteur s’opposent tous à l’utilisation présumée de leur travail sans une compensation appropriée.
Le cas de « Books3 »
Nombre des poursuites intentées par les auteurs de livres sont liées à la piraterie. Les affaires allèguent que des entreprises technologiques, notamment Meta, Microsoft et OpenAI, ont utilisé le controversé ensemble de données « Books3 » pour former leurs modèles d’IA.
Books3 a été créé par le chercheur en IA Shawn Presser en 2020, qui a extrait les données de la bibliothèque du site « pirate » Bibliotik. L’ensemble de données a été largement partagé en ligne et ajouté à d’autres bases de données, y compris « The Pile », un ensemble de données d’entraînement de l’IA compilé par EleutherAI.
Après la réaction des détenteurs de droits d’auteur et des organismes de lutte contre la piraterie, Books3 a été retiré en raison de problèmes de droits d’auteur. Cependant, pour bon nombre des entreprises qui auraient formé leurs modèles d’IA avec cet ensemble de données, il reste encore des conséquences juridiques à régler.
Les auteurs poursuivent NVIDIA pour violation du droit d’auteur
Le vendredi, les auteurs américains Abdi Nazemian, Brian Keene et Stewart O’Nan ont rejoint le flot de poursuites judiciaires en déposant une plainte pour violation du droit d’auteur contre NVIDIA. L’entreprise, dont la capitalisation boursière dépasse les 2 billions de dollars, est principalement connue pour ses GPU et les logiciels et services associés, mais elle possède également ses propres modèles d’IA.
Dans une plainte collective concise déposée devant un tribunal fédéral de Californie, les auteurs affirment que NVIDIA a utilisé l’ensemble de données Books3 pour entraîner ses modèles de langage NeMo Megatron. Les modèles sont hébergés sur Hugging Face, où il est indiqué qu’ils sont formés sur l’ensemble de données « The Pile » d’EleutherAI, qui comprend des livres piratés.
En mettant deux et deux ensemble, les plaignants concluent que les modèles de NVIDIA ont été formés sur des livres piratés, y compris les leurs, sans leur autorisation.
« NVIDIA a admis avoir formé ses modèles NeMo Megatron sur une copie de l’ensemble de données The Pile. Par conséquent, NVIDIA a nécessairement également formé ses modèles NeMo Megatron sur une copie de Books3, car Books3 fait partie de The Pile », indique la plainte.
« Certains livres écrits par les plaignants font partie de Books3, y compris les œuvres contrefaites, et NVIDIA a donc nécessairement formé ses modèles NeMo Megatron sur une ou plusieurs copies des œuvres contrefaites, en violant ainsi directement les droits d’auteur des plaignants. »
Dommages pour violation directe du droit d’auteur
En s’appuyant sur la même logique, les auteurs accusent l’entreprise de violation directe du droit d’auteur, notant que NVIDIA a copié leurs livres pour les utiliser à des fins de formation de l’IA. Les détenteurs de droits d’auteur réclament une compensation sous forme de dommages réels ou de dommages-intérêts statutaires.
La poursuite collective comprend actuellement trois auteurs, mais d’autres pourraient être ajoutés à l’affaire au fur et à mesure de son avancement. NVIDIA n’a pas encore répondu aux allégations, mais à la lumière d’affaires similaires, elle s’opposera probablement aux demandes et/ou invoquera une défense d’utilisation équitable.
Le mois dernier, OpenAI a réussi à « défaire » plusieurs accusations de violation du droit d’auteur de la part d’auteurs de livres dans une affaire « Books3 » quelque peu similaire. Cependant, le tribunal fédéral de Californie n’a pas examiné les accusations de violation directe du droit d’auteur dans cette affaire, qui devront être discutées en détail à une étape ultérieure.