Apple nomeada em processo de copyright de AI sobre dados de treinamento

Um Processo Construído em Terreno Contestado

Apple está enfrentando um novo processo de copyright de AI ajuizado pela Chicken Soup for the Soul, a editora conhecida por sua série de livros antológicos de longa duração. O processo, primeiro relatado pela Reuters, alega que Apple usou o conteúdo da editora sem autorização para treinar sistemas de AI – mas Apple já se distanciou do conjunto de dados no centro da reclamação.

De acordo com a Apple, a coleta de dados nomeada no processo não alimenta Apple Intelligence, a suíte de recursos de AI baseados em dispositivo e na nuvem implementados em iPhone, iPad e Mac. A distinção importa: se o conjunto de dados contestado nunca foi usado para treinar os modelos que realmente funcionam nos produtos da Apple, a base do processo se torna significativamente mais fraca.

O que o processo alega

O processo segue uma onda de ações de copyright semelhantes ajuizadas por editoras, autores e empresas de mídia contra desenvolvedores de AI nos últimos dois anos. Os reclamantes argumentaram que empresas de AI rasparam e ingeriram seu conteúdo sem consentimento, licença ou compensação para treinar grandes modelos de linguagem – e que isso constitui violação de copyright em escala massiva.

Chicken Soup for the Soul está entre muitas editoras que tomaram ação legal neste espaço, unindo-se às fileiras de organizações como o New York Times, que ajuizou um processo de alto perfil contra OpenAI e Microsoft. Os alvos variam, mas a teoria do dano é amplamente semelhante: texto protegido por copyright foi retirado sem permissão e usado comercialmente.

O que distingue este processo particular é a negação preventiva da Apple. A empresa foi incomumente direta em afirmar que o conjunto de dados citado – acreditado ser um rastreamento da web disponível publicamente – não faz parte do pipeline de treinamento do Apple Intelligence. Essa alegação, se comprovada, poderia complicar consideravelmente o caso do reclamante.

Night sky reveals Milky Way above Turkiye’s Yozgat forest

Proposta de subsídio da OMB provoca forte reação de defensores da ciência espacial

Uma proposta de regra federal sobre subsídios gerou uma resposta pública incomumente grande e alertas de defensores da política espacial, que dizem que ela pode remodelar como a ciência nos EUA é financiada e compartilhada.

Read article

Apple Intelligence e seus dados de treinamento

Apple tem sido discreta sobre as especificidades de como seus modelos de AI são treinados, assim como a maioria dos principais desenvolvedores de AI. A empresa lançou Apple Intelligence com iOS 18 e continuou expandindo o sistema com cada atualização de software. Os recursos incluem ferramentas de escrita, geração de imagens, limpeza de fotos e integração com ChatGPT para solicitações mais complexas.

Apple afirmou que seus modelos baseados em dispositivo são treinados usando uma combinação de dados licenciados e dados sintéticos gerados pela própria Apple – uma abordagem projetada para limitar a exposição legal e melhorar a privacidade. A empresa não divulgou uma lista abrangente de fontes de dados, o que é padrão em toda a indústria.

O conjunto de dados referenciado no processo da Chicken Soup for the Soul parece ser um corpus da web aberto separado que circula amplamente na pesquisa de AI. A posição da Apple é que mesmo que dados desse corpus existam em algum lugar de sua infraestrutura de pesquisa, eles não entraram nos modelos que constituem Apple Intelligence como um produto.

Paisagem legal mais ampla

A onda de litígios de copyright de AI não mostra sinais de desaceleração. Os tribunais ainda estão trabalhando em questões fundamentais – incluindo se treinar uma AI em texto protegido por copyright constitui uso justo, como os danos poderiam parecer em escala e se os resultados dos modelos de AI constituem obras derivadas.

Os resultados de casos marcantes contra OpenAI e outros estão sendo observados de perto por toda a indústria. Uma sentença que declare o treinamento de AI categoricamente infrator teria consequências generalizadas. Uma sentença que sustente uma defesa ampla de uso justo, inversamente, resolveria o ambiente legal a favor dos desenvolvedores de AI por anos.

Para Apple, os riscos se estendem muito além deste único processo. A empresa se posicionou privacidade e desenvolvimento responsável de AI como valores centrais da marca. Estar associado a uso massivo não autorizado de dados – mesmo que a alegação seja finalmente descartada – vai contra essa narrativa.

Análise do Joolca Hottap Go: Um Chuveiro Portátil de $700 para Aventureiros

O Joolca Hottap Go é um sistema premium de água quente portátil tudo-em-um para camping, vida em van e trabalho ao ar livre. Preço de $554 mais bateria opcional, oferece conveniência e conforto, mas tem um custo elevado.

Read article

O que vem a seguir

O caso está em estágios iniciais, e nenhuma data de julgamento foi marcada. Apple deve questionar o processo com base em que o conjunto de dados específico citado não foi usado em seus produtos de AI, potencialmente buscando uma moção inicial de arquivamento.

Analistas legais observam que a divulgação proativa da Apple – afirmar publicamente que o conjunto de dados não alimenta Apple Intelligence antes do processo ganhar tração – é um movimento estratégico para esclarecer o registro desde cedo. Também sinaliza que Apple antecipou esse tipo de ataque legal e preparou uma resposta antecipadamente.

Se essa defesa se sustenta dependerá do que a descoberta revela sobre o pipeline de treinamento real da Apple. Se os registros de fornecimento de dados internos da Apple apoiam suas alegações públicas, o caminho do reclamante para indenizações fica estreito. Se não, a empresa enfrenta a mesma exposição legal que capturou outros desenvolvedores de AI.

O processo ressalta uma tensão crescente na indústria de tecnologia: sistemas de AI requerem enormes quantidades de texto para atingir viabilidade comercial, e o marco legal para adquirir esse texto responsavelmente ainda está sendo escrito em tempo real.

Este artigo é baseado em relatórios do 9to5Mac. Leia o artigo original.

Originally published on 9to5mac.com

Apple é processada por dados de treinamento de AI que diz não usar