Contenido
OpenAI signe des contrats avec Le Monde et Prisa Media pour alimenter son chatbot avec des actualités en français et en espagnol
OpenAI a annoncé mercredi qu’elle avait signé des contrats avec Le Monde et Prisa Media pour apporter du contenu d’actualité français et espagnol à son chatbot ChatGPT. Dans un article de blog, OpenAI a déclaré que ce partenariat permettra de mettre en avant la couverture des événements actuels des deux organisations, provenant de marques telles que El País, Cinco Días, As et El Huffpost, devant les utilisateurs de ChatGPT, tout en contribuant à l’ensemble croissant de données d’entraînement d’OpenAI.
Plusieurs accords de licence déjà conclus par OpenAI
OpenAI a déjà conclu plusieurs accords de licence avec des fournisseurs de contenu. Il s’agit notamment de la bibliothèque de médias stock Shutterstock (pour les images, vidéos et données d’entraînement musicales), de l’Associated Press, d’Axel Springer (propriétaire de Politico et Business Insider, entre autres), de Le Monde et de Prisa Media. Les termes financiers de ces accords n’ont pas été divulgués publiquement, mais selon les informations rapportées par The Information en janvier, OpenAI aurait proposé aux éditeurs entre 1 et 5 millions de dollars par an pour accéder à leurs archives. Il est estimé qu’OpenAI dépense entre 4 et 20 millions de dollars par an pour les licences d’articles d’actualité.
Les conséquences des accords de licence sur l’innovation dans le domaine de l’IA
Cependant, certains experts s’inquiètent des conséquences de ces accords de licence sur l’innovation dans le domaine de l’IA. Hunter Walk, associé chez Homebrew et co-fondateur de Screendoor, estime que les coûts élevés des licences peuvent constituer un obstacle à l’entrée pour les concurrents d’OpenAI, empêchant ainsi une concurrence saine et l’émergence de nouvelles start-up. Il suggère la mise en place d’un « safe harbor » réglementé qui protégerait les fournisseurs d’IA de toute responsabilité légale tant qu’ils respectent certaines normes de transparence et d’éthique.
Le débat sur la nécessité des licences d’utilisation des données d’entraînement
Cependant, certains se demandent si les licences d’utilisation des données d’entraînement devraient simplement être considérées comme un coût nécessaire dans le domaine de l’IA. Ils soutiennent que les éditeurs d’articles d’actualité devraient être rémunérés de manière équitable, mais que les concurrents d’OpenAI et les chercheurs devraient également avoir accès aux mêmes données que les grandes entreprises. Des subventions et des investissements plus importants pourraient être envisagés comme des moyens de soutenir ces acteurs. Cependant, il reste à déterminer dans quelle mesure l’utilisation des données d’entraînement peut être protégée par le principe d’utilisation équitable.
Les enjeux pour l’industrie des médias et de l’IA
Ce débat soulève également des questions sur l’impact de l’IA sur l’industrie des médias. Si les moteurs de recherche, tels que Google, intègrent de plus en plus l’IA dans leurs résultats, cela pourrait réduire considérablement le trafic vers les sites web d’actualités. Certains estiment donc qu’il est nécessaire de trouver un équilibre entre la rémunération des éditeurs et l’accès équitable aux données d’entraînement pour les nouveaux acteurs de l’IA.
Il est donc essentiel de continuer à débattre de ces questions et à trouver des solutions qui permettent à la fois de soutenir l’industrie des médias et de favoriser l’innovation dans le domaine de l’IA. Sinon, nous risquons de voir une concentration du pouvoir entre les mains de quelques grandes entreprises et une fuite des cerveaux académiques vers ces acteurs dominants.