Google écope d'une amende de 270 millions de dollars en France après que l'autorité a découvert l'utilisation des données des éditeurs de presse pour Gemini

Contenido

Une amende de 250 millions d’euros pour Google

Dans une saga sans fin entre Google et l’autorité de la concurrence française concernant les droits d’auteur des extraits de news, l’Autorité de la Concurrence a annoncé une amende de 250 millions d’euros contre le géant de la technologie mercredi (environ 270 millions de dollars au taux de change actuel).

Selon l’autorité de la concurrence, Google a ignoré certains de ses engagements antérieurs envers les éditeurs de news. Mais la décision est particulièrement notable car elle met en lumière autre chose d’actualité – en s’accrochant à l’utilisation par Google du contenu des éditeurs de news pour former son modèle d’IA générative Bard/Gemini.

L’autorité de la concurrence a reproché à Google de ne pas avoir informé les éditeurs de news de l’utilisation de leur contenu protégé par le droit d’auteur par GenAI. Cela fait suite aux engagements antérieurs pris par Google visant à garantir des négociations équitables avec les éditeurs concernant la réutilisation de leur contenu.

Des problèmes de droits d’auteur et de concurrence

En 2019, l’Union européenne a adopté une réforme pan-européenne du droit d’auteur numérique qui étend les protections du droit d’auteur aux titres et extraits de news. Les agrégateurs de news, tels que Google News, Discover et la rubrique « Top Stories » des pages de résultats de recherche, avaient précédemment récupéré et affiché ces news sur leurs produits sans aucune compensation financière.

A l’origine, Google a cherché à contourner la loi en désactivant Google News en France. Mais l’autorité de la concurrence est rapidement intervenue – considérant son action unilatérale comme un abus de position dominante sur le marché qui risquait de nuire aux éditeurs. Cette intervention a essentiellement forcé Google à conclure des accords avec les éditeurs locaux concernant la réutilisation de leur contenu. Mais en 2021, Google a été condamné à une amende de 592 millions de dollars après que l’autorité de la concurrence ait constaté de graves violations de ses négociations avec les éditeurs et les agences locales.

Le géant de la technologie a qualifié la sanction de « disproportionnée » et a déclaré qu’il ferait appel. Mais il a ensuite cherché à régler le différend en proposant une série d’engagements et en retirant son appel. Les engagements ont été acceptés par l’Autorité française et comprennent la transmission d’informations clés aux éditeurs et des négociations équitables.

Google a signé des accords de droits d’auteur avec des centaines d’éditeurs en France – qui relèvent de l’accord conclu avec l’Autorité. Son activité dans ce domaine est donc très réglementée.

Aucun appel

Google a accepté de ne pas contester les dernières conclusions de l’Autorité, en échange d’un processus accéléré et d’un paiement financier.

Cependant, la directrice générale de Google pour les partenariats avec les médias et l’édition, Sulina Connal, a exprimé son mécontentement dans un long billet de blog, affirmant que « l’amende n’est pas proportionnée aux problèmes soulevés » par l’autorité.

Le billet de blog suggère que Google veut vraiment mettre un terme à cette saga cette fois-ci, Connal écrivant également : « Nous avons accepté de régler cette affaire parce qu’il est temps de passer à autre chose et, comme le montrent nos nombreux accords avec les éditeurs, nous voulons nous concentrer sur l’objectif plus large d’approches durables pour connecter les gens à un contenu de qualité et travailler de manière constructive avec les éditeurs français ».

Avec l’IA générative en jeu et la course concurrentielle pour lancer des outils, le calcul de Google sur la façon d’aborder la réutilisation du contenu est différent.

L’utilisation de GenAI en question

L’action menée aujourd’hui par l’autorité de la concurrence française montre qu’elle s’est concentrée sur l’utilisation par Google du contenu des éditeurs de news et des agences pour la formation de son modèle d’IA générative et de son service de chatbot AI Bard (maintenant appelé Gemini).

Elle a constaté que Google utilisait le contenu des éditeurs et des agences de presse pour former Bard, son outil d’IA génératif lancé en juillet 2023, « sans informer les titulaires de droits d’auteur ou l’Autorité », selon son communiqué de presse.

Sur ce point, la défense de Google est double. Dans son billet de blog, l’entreprise écrit que l’autorité de la concurrence « ne remet pas en question la façon dont le contenu web est utilisé pour améliorer les nouveaux produits comme l’IA générative, ce qui est déjà abordé à l’article 4 de la DCDU » [Directive sur le droit d’auteur de l’UE].

L’article 4 de la directive sur le droit d’auteur établit une « exception ou limitation pour la fouille de textes et de données » – spécifiquement pour les « reproductions et extractions d’œuvres et d’autres objets protégés légalement accessibles à des fins de fouille de textes et de données ».

Cependant, dans son communiqué de presse, l’Autorité fait valoir qu’il n’a pas encore été déterminé si l’exemption s’applique ici. (Il est intéressant de noter que la clause pertinente fait référence à des « œuvres légalement accessibles » – alors que Google est lié par un engagement juridiquement contraignant envers l’autorité de la concurrence pour informer les titulaires de droits d’auteur de l’utilisation de leurs œuvres protégées et qu’il semble ne pas l’avoir fait dans ce cas.)

« En ce qui concerne la déclaration de savoir si l’utilisation du contenu des news pour former un service d’intelligence artificielle relève des droits voisins et de la protection, cette question n’a pas encore été résolue », a écrit l’autorité de la concurrence. « Cependant, l’Autorité estime que Google a enfreint son engagement n°1 en omettant d’informer les éditeurs que leur contenu avait été utilisé pour former Bard ».

Le billet de blog de Google mentionne également brièvement le projet de loi de l’UE sur l’IA, suggérant qu’il est pertinent. Cependant, la législation n’est pas encore en vigueur car elle est en attente d’adoption finale par le Conseil européen.

La future législation sur l’IA stipulera également que les développeurs doivent respecter les règles de droit d’auteur du bloc. Et elle introduit des exigences en matière de transparence dans cet objectif – les obligeant à mettre en place une politique de respect du droit d’auteur de l’UE ; et à rendre publiquement disponible un « résumé suffisamment détaillé » du contenu utilisé pour la formation des modèles d’IA à usage général (comme Gemini/Bard).

Cette exigence future pour les créateurs de modèles de publier un résumé des données d’entraînement facilitera peut-être à l’avenir la rémunération équitable des éditeurs de news dont le contenu protégé a été utilisé pour la formation de l’IA générative en vertu du droit d’auteur de l’UE.

Aucune option technique d’exclusion

L’Autorité souligne également que Google n’a pas fourni, avant le 28 septembre 2023, une solution technique permettant aux éditeurs et aux agences de presse de se retirer de l’utilisation de leur contenu pour former Bard sans que cela n’affecte l’affichage de leur contenu sur d’autres services de Google.

Jusqu’à cette date, les éditeurs et les agences de news qui souhaitaient se retirer de cette utilisation devaient insérer une instruction qui bloque toute indexation du contenu par Google, y compris pour les services de recherche, de découverte et de news de Google. Ces services font spécifiquement partie des négociations sur les revenus liés aux droits voisins », écrit l’Autorité, ajoutant : « À l’avenir, l’Autorité examinera attentivement l’efficacité des processus de retrait de Google ».

Plus techniquement, entre juillet et septembre 2023, les éditeurs de news pouvaient insérer une balise « noindex » dans le fichier robots.txt pour s’assurer que leur contenu n’était pas utilisé pour former le modèle d’IA de Google. Ce fichier robots.txt est placé à la racine des serveurs web et contient diverses instructions pour les moteurs de recherche. Le robot d’exploration web de Google examine les instructions de ces fichiers pour indexer les sites web.

Mais une balise « noindex » signifie que votre site web disparaît complètement de Google. En septembre 2023, Google a ajouté plus de granularité et a créé une règle « Google-Extended » différente de la règle « noindex ». En optant pour l’instruction « Google-Extended » de Google, les éditeurs de sites web indiquent qu’ils ne souhaitent pas contribuer à l’amélioration des modèles actuels et futurs de Gemini.

D’autres lacunes

L’Autorité sanctionne également Google pour une série d’autres problèmes liés à sa manière de négocier avec les éditeurs de news français, constatant qu’il n’a pas fourni toutes les informations nécessaires aux éditeurs pour garantir une négociation équitable de la rémunération de leur contenu.

Dans son communiqué de presse, elle écrit que les informations de Google aux éditeurs sur sa méthodologie pour calculer le montant qui leur est dû étaient « particulièrement opaques ».

Elle a également constaté que Google ne respectait pas les critères de non-discrimination, visant à garantir un traitement équitable des éditeurs. Et elle a critiqué une décision de Google d’imposer un « seuil minimum » de rémunération – c’est-à-dire en dessous duquel il ne verserait aucune rémunération aux éditeurs – l’Autorité qualifiant cela d’introduction de discrimination entre les éditeurs « dans son principe même ». En dessous d’un certain seuil, tous les éditeurs se voient « arbitrairement attribuer une rémunération nulle, quel que soit leur situation respective », note également son communiqué de presse.

En outre, l’Autorité a constaté des problèmes dans les calculs de Google concernant les « revenus indirects », affirmant que le « package » qu’il proposait n’était pas conforme aux décisions antérieures ou à l’arrêt de la Cour de justice d’appel, d’octobre 2020.

Elle a également déclaré que Google n’avait pas respecté son engagement de mettre à jour les contrats de rémunération conformément à ses engagements.

Google écope d’une amende de 270 millions de dollars en France après que l’autorité a découvert l’utilisation des données des éditeurs de presse pour Gemini