Anthropic constate que de meilleurs agents IA négocient de meilleurs accords

Le marché interne d’Anthropic montre que de meilleurs agents IA concluent de meilleurs deals discrètement

Anthropic affirme que des agents IA plus puissants ont négocié de meilleurs prix et conclu davantage d’accords sur un véritable marché interne, tandis que les utilisateurs représentés par des modèles plus faibles n’ont pas perçu d’écart d’équité.

DT Editorial AI

Apr 25, 2026·5 min read·1,071 words

Les modèles les plus puissants ont mieux fait, et les utilisateurs ne l’ont pas remarqué

Une expérience interne d’Anthropic suggère qu’une forme subtile mais importante d’inégalité liée à l’IA est peut-être déjà en train d’émerger : les personnes représentées par des modèles plus puissants peuvent obtenir de meilleurs résultats sans que personne autour d’elles ne réalise qu’un écart existe. Selon le texte source fourni, Anthropic a mené en décembre 2025 un marché interne d’une semaine baptisé “Project Deal”, au cours duquel 69 employés ont utilisé des agents IA basés sur Claude pour acheter et vendre de vrais biens sur Slack.

Chaque participant a reçu un budget de 100 dollars. Avant l’ouverture du marché, Claude a interrogé les volontaires sur ce qu’ils voulaient acheter ou vendre, leurs préférences de prix et le style de négociation qu’ils souhaitaient voir adopter par leur agent. Anthropic a ensuite utilisé ces informations pour générer des invites système personnalisées. Après cela, les agents IA ont pris en charge le processus de bout en bout : rédaction d’annonces, recherche de contreparties, formulation d’offres, marchandage et conclusion des transactions. Les humains n’intervenaient qu’à la fin pour échanger les biens.

Le principal biais expérimental était caché aux participants. Anthropic a exécuté des versions parallèles du marché. Dans certaines, chaque participant était représenté par Claude Opus 4.5, décrit dans le texte source comme le modèle de pointe d’Anthropic à l’époque. Dans d’autres, les participants avaient 50 % de chances d’être représentés par Claude Haiku 4.5, le plus petit modèle de l’entreprise.

Le résultat n’était pas seulement technique. Il était social.

Selon la source, le modèle Opus, plus capable, obtenait systématiquement de meilleurs prix et concluait plus d’accords en moyenne que Haiku. Dans le même temps, des instructions de négociation plus agressives n’ont pas produit de différence statistiquement significative dans les résultats. Autrement dit, la capacité du modèle comptait davantage que le simple fait de dire au système de négocier plus durement.

Cela va à l’encontre d’un réflexe courant dans l’adoption de l’IA en entreprise, où les organisations supposent parfois que le style du prompt ou le comportement de surface déterminera l’essentiel de la valeur. Les résultats d’Anthropic suggèrent que la puissance intrinsèque du modèle peut compter davantage que le ton. Si ce schéma se généralise, la qualité de l’agent lui-même pourrait discrètement façonner qui obtient des conditions favorables dans les transactions numériques.

Le résultat le plus frappant est peut-être perceptif plutôt qu’économique. Anthropic dit que les utilisateurs dont les agents Haiku plus faibles ont obtenu des résultats objectivement moins bons ont malgré tout jugé leurs transactions tout aussi équitables que ceux représentés par Opus. C’est cet écart que l’entreprise désigne comme une forme d’“inégalité invisible” dans la prise de décision assistée par l’IA.

C’est une idée lourde de conséquences. Les formes traditionnelles d’inégalité sont souvent visibles dans les prix, l’accès ou la qualité du service. Ce qu’Anthropic pointe est plus difficile à détecter : deux personnes peuvent se sentir également satisfaites tandis que l’une d’elles a systématiquement reçu une représentation moindre de la part de la machine agissant en son nom.

AI & Robotics

Pékin demanderait aux entreprises technologiques privées de refuser les fonds américains sans l’aval de l’État, prolongeant ainsi une dynamique plus large visant à maintenir sous un contrôle intérieur plus strict les actifs et la propriété liés à l’IA jugés stratégiques.

DT Editorial AI·Apr 25, 2026·via the-decoder.com

AI & Robotics

Le GPT-5.5 d’OpenAI a pris la tête d’un important classement de benchmarks et semble plus économe en tokens que son prédécesseur, mais les éléments rapportés dans la source indiquent que le modèle hallucine encore à un rythme élevé.

DT Editorial AI·Apr 25, 2026·via the-decoder.com

La question réglementaire est déjà là

Le discours d’Anthropic sur l’inégalité invisible devrait résonner bien au-delà de cette seule expérience. Si des organisations déploient différentes classes d’agents IA selon les niveaux hiérarchiques, les segments de clientèle ou les services publics, elles risquent de créer un traitement inégal sans signe clair d’injustice au moment de l’usage.

C’est un problème de gouvernance plus difficile qu’une simple transparence. Dire aux utilisateurs qu’une IA était impliquée ne répond pas à la question de savoir si cette IA était aussi capable que celle utilisée pour quelqu’un d’autre. Et lorsque l’expérience utilisateur semble toujours équitable, le marché ou l’institution peuvent ne pas subir de pression immédiate pour corriger le déséquilibre.

Project Deal apparaît donc comme un signal d’alerte précoce. Il suggère que l’accès à l’IA ne concerne pas seulement le fait d’obtenir ou non un assistant numérique, mais aussi l’assistant que l’on obtient et son niveau de capacité lorsque l’enjeu est réel.

Anthropic a mené un marché interne d’une semaine sur Slack en utilisant des agents Claude pour de vraies transactions.
Claude Opus 4.5 a obtenu de meilleurs prix et plus d’accords, en moyenne, que Claude Haiku 4.5.
Les utilisateurs représentés par des agents plus faibles n’ont pas perçu le désavantage, malgré des résultats moins bons.

Cet article est basé sur le reportage de The Decoder. Lire l’article original.

Le marché interne d’Anthropic montre que de meilleurs agents IA concluent de meilleurs deals discrètement

Les modèles les plus puissants ont mieux fait, et les utilisateurs ne l’ont pas remarqué

Le résultat n’était pas seulement technique. Il était social.

Related Articles

Keep Reading

L’accord de Cohere sur Aleph Alpha fait de l’IA souveraine une stratégie transfrontalière

Les agents IA deviennent des intermédiaires

Le prompting ne suffira peut-être pas

OpenAI va plus loin dans les workflows agentiques avec le lancement de GPT-5.5

La question réglementaire est déjà là

Comments (0)

La Chine durcit l’accès au capital américain pour les opérations technologiques nationales

GPT-5.5 Rehausse le Plafond des Benchmarks IA, mais Conserve une Faiblesse Connue