Raspagem de Dados IA

Reddit Processa Anthropic por Raspagem de Dados

Tecnologia

O Reddit entrou com uma ação judicial contra a Anthropic, criadora do chatbot Claude, alegando o uso não autorizado de seus dados por anos para treinar seu modelo de IA. Essa medida segue a postura cada vez mais firme do Reddit contra empresas que raspam sua plataforma para desenvolvimento de IA sem permissão.

As Alegações

A ação judicial alega que a Anthropic começou a treinar o Claude em dados do Reddit desde dezembro de 2021. Evidências apresentadas incluem uma captura de tela que sugere que o próprio Claude reconhece essa fonte de dados de treinamento. O Reddit afirma que, apesar de repetidos avisos e pelo menos 100.000 tentativas de acesso não autorizado detectadas por meio de bots automatizados, a Anthropic continuou suas ações. A empresa argumenta que não se tratou de um mal-entendido, mas de um esforço deliberado para lucrar com os dados do Reddit, ignorando considerações legais e éticas.

A Posição do Reddit e Acordos de Licenciamento

O vasto arquivo de discussões online do Reddit tornou-se um recurso altamente valioso para o desenvolvimento de IA. A plataforma já estabeleceu acordos lucrativos de licenciamento com empresas como Google e OpenAI. A ação judicial destaca a recusa da Anthropic em se envolver em discussões de licenciamento semelhantes, contrastando seu comportamento com outras empresas de IA. O Reddit enfatiza a falha da Anthropic em respeitar a privacidade do usuário, incluindo a não remoção de postagens excluídas de seus sistemas. A empresa descreve um contraste marcante entre a imagem pública da Anthropic e suas supostas ações privadas.

Resposta da Anthropic

Em resposta, a Anthropic declarou que discorda das alegações do Reddit e pretende montar uma defesa vigorosa.

1 Imagem de Raspagem de Dados IA:
imageRaspagem de Dados IA

Fonte: Engadget