Reddit Demanda a Anthropic por 'Raspar' Datos para Entrenar su IA Claude

Reddit Demanda a Anthropic por 'Raspar' Datos para Entrenar su IA Claude - Imagen ilustrativa del artículo Reddit Demanda a Anthropic por 'Raspar' Datos para Entrenar su IA Claude

Reddit ha presentado una demanda contra la empresa de inteligencia artificial Anthropic, acusándola de "raspar" ilegalmente comentarios de usuarios para entrenar su chatbot Claude. La plataforma de redes sociales alega que Anthropic utilizó bots automatizados para acceder al contenido de Reddit a pesar de haber sido notificada de no hacerlo, y que "intencionalmente entrenó sus modelos con los datos personales de los usuarios de Reddit sin solicitar su consentimiento".

Anthropic ha negado las acusaciones, afirmando que defenderán su posición "vigorosamente". La demanda fue presentada en el Tribunal Superior de California en San Francisco, donde tienen sede ambas compañías.

¿Qué alega Reddit?

Según Reddit, Anthropic accedió a su plataforma más de 100.000 veces desde julio de 2024, incluso después de que Anthropic afirmara haber bloqueado sus bots. Reddit describe a Anthropic como una "empresa de inteligencia artificial de reciente aparición que se presenta como el caballero blanco de la industria de la IA", pero alega que "no es nada de eso". La demanda critica la aparente hipocresía de Anthropic, contrastando su imagen pública de respeto por las reglas con su presunto comportamiento de ignorar las mismas para obtener beneficios.

El Valor de los Datos de Reddit

Ben Lee, director legal de Reddit, ha declarado que la "explotación comercial" del contenido de Reddit por parte de Anthropic podría valer miles de millones de dólares. Lee subraya la importancia de la "humanidad" de Reddit en un mundo cada vez más dominado por la IA, destacando que la plataforma alberga casi 20 años de discusiones humanas ricas y diversas. Estas conversaciones, según Lee, son cruciales para el entrenamiento de modelos de lenguaje como Claude.

Reddit ha firmado previamente acuerdos de licencia con Google, OpenAI y otras compañías, permitiéndoles entrenar sus sistemas de IA con el contenido público de Reddit a cambio de compensación. Estos acuerdos, según Reddit, garantizan la protección de la privacidad de los usuarios y evitan el spam.

¿Cuál es el futuro de esta demanda?

El resultado de esta demanda podría tener implicaciones significativas para la industria de la IA y la forma en que las empresas entrenan sus modelos de lenguaje. Establecería un precedente importante sobre los derechos de propiedad intelectual de los datos generados por los usuarios en plataformas online.