Contenido
Riesgos de infracción de los derechos de autor con la IA generativa
El uso de IA generativa -modelos capaces de generar texto, imágenes, música, etc. a partir de una instrucción- puede dar lugar a una infracción de los derechos de autor, aunque no haya intención de hacerlo. Pero, ¿quién es responsable de los costes legales y los daños y perjuicios cuando se produce una situación de este tipo? La respuesta depende.
En el panorama en constante evolución de la IA generativa, las empresas que monetizan esta tecnología -desde start-ups hasta gigantes tecnológicos como Google, Amazon y Microsoft- están adoptando enfoques muy diferentes para gestionar los riesgos de la propiedad intelectual.
Algunos proveedores se han comprometido a defender, económicamente y por otros medios, a los clientes que utilicen sus herramientas de IA generativa y se encuentren con una infracción de los derechos de autor. Otros han publicado políticas diseñadas para protegerse de la responsabilidad, dejando a los clientes la carga de los costes legales.
Pero las condiciones de uso de la mayoría de las herramientas de IA generativa son complejas y están redactadas en jerga legal. Para aclararlo, me puse en contacto con los proveedores para conocer sus políticas de protección de los clientes que pudieran infringir los derechos de autor con sus textos, imágenes, vídeos y música generados por IA.
Las respuestas - y las no respuestas - fueron instructivas.
Reutilización de datos
Los modelos generativos de IA "aprenden" a partir de ejemplos para crear ensayos, códigos, obras de arte, música e incluso letras para acompañar esa música. Se entrenan con millones o miles de millones de libros electrónicos, obras de arte, correos electrónicos, canciones, extractos de audio, grabaciones de voz, etc., la mayoría procedentes de sitios web públicos.
Algunos de estos ejemplos son de dominio público, al menos para los proveedores que recopilan datos de la web. Otros no lo son, o están sujetos a una licencia restrictiva que exige citarlos o formas específicas de compensación.
La legalidad de que los proveedores utilicen datos sin permiso es otra cuestión que se debate en los tribunales. Pero lo que podría causar problemas a los usuarios de IA generativa es la reutilización, es decir, cuando el modelo genera una copia exacta de un ejemplo de entrenamiento.
Arriba, imágenes generadas por Stable Diffusion, una IA generadora de imágenes, a partir de pies de foto aleatorios en el conjunto de entrenamiento del modelo. Abajo, imágenes generadas para que coincidan con las originales. Créditos de las fotos : Somepalli et al.
Microsoft, GitHub y OpenAI están siendo demandados en una demanda colectiva que les acusa de infringir los derechos de autor al permitir que Copilot, una IA generadora de código, reutilice fragmentos de código con licencia sin acreditarlo. Además, miles de escritores han firmado una carta abierta en la que denuncian las tecnologías de IA generativa que "imitan y regurgitan" su "lenguaje, historias, estilo e ideas".
El negocio está en auge.
Autores de California y Nueva York han demandado a OpenAI por robo de la propiedad intelectual de sus obras. Proveedores de herramientas de generación de imágenes como Stability AI y Midjourney están siendo demandados por artistas y sitios de imágenes con licencia como Getty Images. Universal Music Group también está intentando prohibir la distribución de música generada por IA que imita el estilo de los músicos a los que representa enviando notificaciones de retirada para que se retiren las canciones.
Por eso no es de extrañar que, según una reciente encuesta de Acrolinx a empresas de la lista Fortune 500, casi un tercio de ellas considere la propiedad intelectual su mayor preocupación a la hora de utilizar IA generativa.
Sin embargo, la amenaza de infringir los derechos de autor con una herramienta de IA generativa no ha disuadido a los inversores de inyectar miles de millones en las nuevas empresas que desarrollan estas herramientas. Sin embargo, está por ver si la situación se mantendrá durante mucho más tiempo.
Cuestión de compensación
Ante la incertidumbre, cabría pensar que los proveedores de IA generativa apoyarían incondicionalmente a sus clientes, aunque sólo fuera para disipar sus temores a demandas por propiedad intelectual.
Pero no es así.
El lenguaje utilizado en algunos contratos de servicios -en particular las cláusulas de indemnización, que especifican cuándo se puede reembolsar a los clientes los daños causados por reclamaciones de terceros- muestra que no todos los proveedores están dispuestos a arriesgarse a una sentencia judicial que les obligue a revisar su enfoque de la formación de modelos generativos, o incluso, en el peor de los casos, su modelo de negocio.
Por ejemplo, Anthropic, que acaba de firmar un acuerdo con Amazon para recaudar hasta 4.000 millones de dólares y al parecer busca otros 2.000 millones de inversión de Google y otros, se reserva el derecho a "eximirse" a sí misma y a sus socios de responsabilidad por cualquier daño derivado del uso de su IA generativa, incluidos los relacionados con la propiedad intelectual.
Les pregunté directamente si apoyarían legal o económicamente a un cliente acusado de infringir los derechos de autor utilizando sus modelos generados por IA, pero la empresa se negó a responder.
AI21 Labs, otra start-up bien financiada que desarrolla un conjunto de herramientas de edición generativa de texto, también se negó a responder. Así que consulté su política.
A21 Labs afirma que podría "asumir la defensa y el control exclusivos" de una demanda interpuesta contra un cliente si éste opta por no defenderse o resolver el litigio por sí mismo. Pero esto no correrá a su cargo, sino al del cliente.
OpenAI -probablemente el proveedor de IA generativa con más éxito en la actualidad, con más de 10.000 millones de dólares en capital riesgo e ingresos cercanos a los 1.000 millones- me remitió a sus condiciones de uso, que limitan la responsabilidad de la empresa a "la cantidad que [un cliente] pagó por el servicio [de OpenAI] que dio lugar a [la] reclamación en los 12 meses anteriores a que surgiera la responsabilidad o 100 dólares". La política de OpenAI deja claro que, en la mayoría de los casos, la empresa no será parte ni se defenderá de las reclamaciones por infracción de derechos de autor contra sus usuarios.
Los vendedores que desarrollan IA generadora de imágenes y vídeos, donde las posibles infracciones de derechos de autor son un poco más evidentes, no son mucho más solidarios contractualmente que sus competidores basados en texto.
Stability AI, que desarrolla modelos generativos de música además de imágenes y texto, me remitió a las condiciones de uso de su API. La empresa deja en manos de los clientes la defensa frente a acusaciones de infracción de derechos de autor y -a diferencia de otros proveedores de IA generativa- no tiene cláusula de pago en caso de responsabilidad.
Midjourney y Runway.ai no han respondido a mis correos electrónicos, pero he comprobado sus condiciones de uso. La política de Midjourney le exime de cualquier responsabilidad por daños a la propiedad intelectual de terceros. La política de Runway.ai hace lo mismo.
La letra pequeña
Algunos proveedores -quizá cada vez más conscientes de las preocupaciones de los clientes empresariales que se plantean adoptar la IA generativa, o que buscan posicionarse como una alternativa "más segura"- no dudan en comprometerse a proteger a los clientes en caso de demandas por infracción de derechos de autor. Hasta cierto punto.
Amazon, que acaba de lanzar una plataforma para ejecutar y perfeccionar modelos generativos de IA llamada Bedrock, dice que indemnizará (es decir, defenderá) a los clientes contra reclamaciones de que el modelo infringe los derechos de propiedad intelectual de un tercero. Pero la política de indemnización de Amazon sólo se aplica a la familia interna de modelos de análisis de texto de la empresa, denominada Titan, así como al servicio de generación de código de Amazon, CodeWhisperer.
La indemnización de CodeWhisperer es más amplia y se aplica a todas las reclamaciones de propiedad intelectual, incluidas las marcas comerciales. Sin embargo, requiere al menos una suscripción profesional a CodeWhisperer con las funciones de filtrado y defensa de los derechos de autor activadas. Los usuarios gratuitos de CodeWhisper no se benefician de las mismas protecciones. Además, los clientes deben aceptar que AWS se encargue de su defensa y resuelva el litigio "como AWS considere oportuno".
IBM también ofrece una compensación por la propiedad intelectual de sus modelos de IA generativa, Slate y Granite, disponibles a través de su servicio de IA generativa Watsonx.
"En consonancia con el enfoque de IBM a las obligaciones de indemnización, IBM no limita su responsabilidad de indemnización para los modelos desarrollados por IBM", nos dijo un portavoz de IBM a través de correo electrónico. "Esto se aplica a los modelos IBM Watsonx actuales y futuros desarrollados por IBM".
Google no ha respondido a mis correos electrónicos. Pero según las condiciones de uso de la compañía, parece que Google ofrece un cierto defender a los clientes frente a acusaciones de terceros de infracción de los derechos de autor relacionados con sus plantillas de generación de texto e imágenes. Sin embargo, Google especifica que puede suspender el uso por parte del cliente de la plantilla infractora si no se encuentra una solución "comercialmente razonable".
Cohere, respaldada por Google, también incluye una cláusula en sus términos que sugiere que "defenderá, indemnizará y protegerá" a los clientes que se enfrenten a reclamaciones de terceros que aleguen que los diseños de Cohere infringen la propiedad intelectual. Dado el fuerte enfoque empresarial de Cohere, esto no es sorprendente.
Microsoft anunció recientemente que pagaría daños y perjuicios en nombre de los clientes que utilizaran sus productos de inteligencia artificial si eran demandados por infracción de derechos de autor, siempre que dichos clientes utilizaran las "funciones de protección y filtrado" integradas en sus productos.
¿A qué productos se aplica? Aquí es donde las cosas se complican.
Microsoft afirma que su política de indemnización se aplica a las versiones de pago de su gama de servicios de IA "Copilot" (incluido Microsoft 365 Copilot para Word, Excel y PowerPoint) y a Bing Chat Enterprise, la versión empresarial de su chatbot en Bing. También se extiende a GitHub Copilot, el servicio de generación de código desarrollado conjuntamente por Microsoft y OpenAI.
Pero en su política de Azure, Microsoft especifica que los clientes que utilicen "versiones de prueba" de las funciones de IA generativa impulsadas por Azure OpenAI Service son responsables de responder a las reclamaciones de terceros por infracción de derechos de autor.
Kate Downing, abogada especializada en propiedad intelectual con sede en Santa Cruz, impugna específicamente la cláusula de indemnización de Copilot, argumentando que -dada la vaguedad de la cláusula y sus exclusiones- los costes iniciales de hacer valer sus derechos podrían ser demasiado elevados para una empresa.
Por el contrario, Adobe afirma ofrecer una protección de indemnización "total" a los usuarios de Firefly, su plataforma de arte generativo basado en IA, alegando que sus modelos se entrenan con imágenes bajo licencia de las que Adobe ya posee los derechos. Sin embargo, los usuarios deben ser clientes corporativos y están sujetos al mismo límite de responsabilidad de Adobe que se aplica a otras reclamaciones de propiedad intelectual basadas en la tecnología.
Shutterstock, competidor ocasional de Adobe, y Canva también ofrecen compensaciones a todos sus clientes corporativos, una política introducida por la empresa este verano. Lo mismo ocurre con Getty Images (Getty Images y Shutterstock, al igual que Adobe, forman a sus modelos con imágenes bajo licencia).
El camino por recorrer
Parece probable que, a medida que los proveedores de IA generativa, sobre todo las empresas de nueva creación, se vean presionados por los inversores para captar clientes empresariales, la protección por indemnización se convierta en algo habitual. Al fin y al cabo, estos clientes quieren tener la seguridad de no ser demandados por infracción de derechos de autor.
Pero si la situación actual sirve de indicación, no habrá dos pólizas iguales. Y algunas tendrán excepciones que las harán más atractivas en teoría que en la práctica; en otras palabras, serán más una estratagema de marketing que una auténtica protección.
Como una artículo reciente del bufete británico Ferrer & Co, la indemnización no es una "carta de libertad", no es la panacea.
"Nuestro mensaje clave es no considerar la oferta de indemnizaciones del proveedor como una respuesta completa al riesgo de demandas por infracción de terceros", escribe la firma en su blog. "En su lugar, sopesar la oferta de tales indemnizaciones en la balanza a la hora de decidir si utilizar la herramienta de IA generativa de ese proveedor para un proyecto".
Los clientes de IA Generativa deben tener esto en cuenta.