Le dernier conflit autour de l’IA porte sur la copie sans emporter le code

Le différend technologique entre les États-Unis et la Chine entre dans une phase plus précise et plus difficile. La source d’Ars Technica fournie indique que les responsables américains se préparent à répondre à ce qu’ils décrivent comme un vol de propriété intellectuelle à l’“échelle industrielle” visant des laboratoires américains d’IA, la distillation étant au centre de l’argument. C’est important, car la distillation se situe dans une zone grise entre l’interaction normale avec un modèle et l’extraction stratégique.

Les litiges classiques en propriété intellectuelle tournent souvent autour d’éléments évidents : code source, conceptions de puces, secrets commerciaux, documents divulgués. La distillation change la donne. Elle suggère qu’un rival peut apprendre à partir des sorties d’un modèle de pointe à grande échelle, en utilisant ces réponses pour entraîner un système moins coûteux qui capture une partie de la valeur du modèle d’origine sans obtenir directement les poids du modèle.

Pourquoi Washington prend la question au sérieux

Selon la source fournie, les responsables américains estiment que des entités étrangères basées principalement en Chine ont utilisé des dizaines de milliers de comptes relais et des techniques de jailbreak pour exposer des informations propriétaires et extraire de la valeur de systèmes de pointe. Plusieurs entreprises d’IA sont également citées comme ayant formulé des allégations liées à des comportements de chatbot clonés ou copiés.

Du point de vue de Washington, il ne s’agit pas seulement d’un problème de conditions d’utilisation. C’est un problème de compétitivité. Si la distillation permet à des rivaux de compresser des années de développement coûteux de modèles en un cycle d’imitation bien moins cher, les laboratoires leaders perdent une partie de la protection que l’échelle, le calcul et le capital devaient leur offrir.

La réponse politique pourrait redéfinir la PI des modèles

La source note que le Congrès est poussé à traiter l’extraction de modèles comme une forme d’espionnage industriel et à envisager des sanctions plus sévères. C’est important parce que le droit actuel n’a pas été rédigé en tenant compte du comportement des modèles de pointe. Une décision gouvernementale consistant à classer la distillation à grande échelle comme quelque chose de plus proche de l’espionnage que de l’usage abusif redessinerait la frontière juridique autour des systèmes d’IA.

Cette frontière n’est pas anodine. Les modèles d’IA sont conçus pour répondre à des questions. Plus ils deviennent capables, plus il peut être difficile de distinguer l’usage légitime, l’évaluation concurrentielle, le red-teaming et l’extraction délibérée. Les décideurs publics sont désormais appelés à définir où se situe cette ligne.

Le message géopolitique plus large

Ce conflit montre aussi comment la concurrence en IA arrive à maturité. La première phase portait sur les puces, les talents et les lancements de modèles. La suivante concerne le contrôle des sorties, les défenses contre l’imitation et l’opposabilité de la propriété intellectuelle fondée sur les modèles. En d’autres termes, la compétition stratégique remonte la pile.

Cela pourrait avoir des effets au-delà des relations sino-américaines. Si les gouvernements commencent à traiter l’extraction de modèles comme un enjeu de sécurité nationale, les entreprises d’IA pourraient recevoir davantage de renseignements officiels sur les menaces, renforcer les contrôles de compte et faire pression pour des lois criminalisant de nouvelles formes de scraping et d’imitation. Le résultat serait une industrie de l’IA plus verrouillée et davantage orientée sécurité.

Un problème difficile aux conséquences réelles

Le défi tient au fait que la technique centrale en cause est conceptuellement proche de l’apprentissage par observation, qui a toujours fait partie de la concurrence. La différence, selon les responsables américains, tient à l’échelle, à l’automatisation, à la tromperie et à l’intention. Lorsque l’extraction s’effectue via d’immenses réseaux de comptes relais et une évasion systématique, ils signalent que le comportement ne ressemble plus à une concurrence normale et commence à ressembler à une appropriation organisée.

Ce cadrage pourrait bientôt entraîner des sanctions, une nouvelle législation ou un renforcement de l’application des règles. Que ces mesures arrivent vite ou non, un point est déjà clair d’après les sources : la course à l’IA ne consiste plus seulement à construire les meilleurs systèmes en premier. Elle consiste aussi à empêcher les autres de reproduire assez vite leur valeur pour effacer l’avance.

Cet article est basé sur un reportage de Ars Technica. Lire l’article original.

Originally published on arstechnica.com