النماذج الأقوى تفوقت، والمستخدمون لم يلاحظوا

تشير تجربة داخلية أجرتها Anthropic إلى أن شكلاً خفيًا لكنه مهم من عدم المساواة في الذكاء الاصطناعي قد يكون بدأ بالفعل في الظهور: فالأشخاص الذين تمثّلهم نماذج أقوى يمكنهم تحقيق نتائج أفضل من دون أن يلاحظ من حولهم وجود فجوة. ووفقًا للنص المصدر المرفق، أجرت Anthropic في ديسمبر 2025 سوقًا داخلية استمرت أسبوعًا تحت اسم “Project Deal”، استخدم فيها 69 موظفًا وكلاء ذكاء اصطناعي قائمين على Claude لشراء وبيع سلع حقيقية عبر Slack.

حصل كل مشارك على ميزانية قدرها 100 دولار. وقبل افتتاح السوق، أجرى Claude مقابلات مع المتطوعين لمعرفة ما يرغبون في شرائه أو بيعه، وتفضيلاتهم السعرية، وأسلوب التفاوض الذي يريدون أن يتبعه وكيلهم. ثم استخدمت Anthropic هذه المدخلات لتوليد أوامر نظام مخصصة. بعد ذلك، تولى وكلاء الذكاء الاصطناعي العملية من البداية إلى النهاية: كتابة الإعلانات، والعثور على الأطراف المقابلة، وتقديم العروض، والمساومة، وإتمام الصفقات. ولم يتدخل البشر إلا في النهاية لتبادل السلع.

وكانت اللفة التجريبية الأساسية مخفية عن المشاركين. فقد شغّلت Anthropic نسخًا متوازية من السوق. في بعضها، كان كل مشارك ممثلاً بواسطة Claude Opus 4.5، الذي وصفه النص المصدر بأنه نموذج Anthropic الرائد في ذلك الوقت. وفي نسخ أخرى، كانت هناك فرصة بنسبة 50% لأن يكون المشارك ممثلاً بواسطة Claude Haiku 4.5، وهو أصغر نماذج الشركة.

النتيجة لم تكن تقنية فقط، بل اجتماعية أيضًا

وفقًا للمصدر، حصل نموذج Opus الأكثر قدرة باستمرار على أسعار أفضل وأبرم صفقات أكثر في المتوسط من Haiku. وفي الوقت نفسه، فإن تعليمات التفاوض الأكثر عدوانية لم تؤدِّ إلى فرق ذي دلالة إحصائية في النتائج. وبعبارة أخرى، كانت قدرة النموذج أهم من مجرد إخبار النظام بأن يفاوض بقوة أكبر.

وهذا يتعارض مع حدس شائع في تبني الذكاء الاصطناعي داخل المؤسسات، حيث تفترض بعض الجهات أحيانًا أن أسلوب التوجيه أو السلوك الظاهري سيحدد معظم القيمة. وتشير نتائج Anthropic إلى أن قوة النموذج الأساسية قد تكون أهم من النبرة. وإذا تعمم هذا النمط، فقد تحدد جودة الوكيل نفسه بهدوء من يحصل على شروط مواتية في المعاملات الرقمية.

ولعل النتيجة الأكثر لفتًا للانتباه ليست اقتصادية بل إدراكية. تقول Anthropic إن المستخدمين الذين حصلت وكلاؤهم الأضعف من Haiku على نتائج أسوأ موضوعيًا قيّموا معاملاتهم على أنها عادلة بالقدر نفسه الذي قيّم بها المستخدمون الذين مثّلهم Opus صفقاتهم. وهذا التباين هو ما تصفه الشركة بأنه نوع من “عدم المساواة غير المرئية” في اتخاذ القرار بمساعدة الذكاء الاصطناعي.

هذه فكرة ذات تبعات كبيرة. فالصور التقليدية لعدم المساواة تكون غالبًا مرئية في التسعير أو الوصول أو جودة الخدمة. أما ما تشير إليه Anthropic فهو أصعب رصدًا: يمكن لشخصين أن يشعرًا بالرضا نفسه، بينما يكون أحدهما قد تلقى تمثيلًا أسوأ بصورة منهجية من الآلة التي تصرفت نيابة عنه.

وكلاء الذكاء الاصطناعي يتحولون إلى وسطاء

تكتسب Project Deal أهميتها لأنها تنقل النقاش من روبوتات الدردشة إلى الوكالة. فهذه الأنظمة لم تكن مجرد أدوات تجيب عن الأسئلة، بل كانت تمثل الأشخاص في مفاوضات مع آلات أخرى. وهذا يجعلها أقرب إلى الوسطاء العاملين في الأسواق، لا مجرد أدوات إنتاجية.

ومع اتساع هذا الدور، قد تصبح اختلافات النماذج ذات عواقب مباشرة في التجارة والمشتريات والتوظيف وخدمة العملاء والعمليات الداخلية. وإذا كانت الأنظمة الأقوى تتفاوض أفضل باستمرار، أو ترتب المعلومات بكفاءة أعلى، أو تعثر على أطراف مقابلة أفضل، فإن الوصول إلى نموذج رائد يصبح ميزة عملية. وقد لا يدرك من هم على الجانب الأضعف من تلك الفجوة أنهم متضررون أصلًا.

والنص المصدر لا يدعي أن هذه النتيجة تمتد تلقائيًا إلى جميع الأسواق. فقد كانت التجربة داخلية، قصيرة المدة، ومحدودة النطاق. ومع ذلك، فهي تقدم مثالًا ملموسًا على ما من المرجح أن تواجهه الجهات التنظيمية والشركات أكثر فأكثر: عندما تبدأ وكلاء الذكاء الاصطناعي بالتصرف نيابة عن المستخدمين، يمكن لفجوات القدرة أن تتحول إلى فجوات في النتائج.

قد لا يكون ضبط الأوامر كافيًا

من أكثر النتائج فائدة في التقرير أن تعليمات التفاوض العدوانية لم تحقق تحسنًا ذا دلالة إحصائية. وهذا يشير إلى أن المؤسسات لا يمكنها افتراض أنها ستعوض النماذج الأضعف بمجرد ضبط الأوامر لتكون أكثر حزمًا.

بالنسبة للمطورين ومشتري أنظمة الذكاء الاصطناعي، يعد ذلك تحذيرًا عمليًا. فقد يعتمد أداء الوكيل أقل على الصياغة الشخصية وأكثر على جودة الاستدلال واتخاذ القرار في جوهره. فالواجهة الأنيقة أو الأسلوب الحازم لا يعنيان بالضرورة تمثيلًا أقوى.

وتكتسب هذه النقطة أهمية لأن كثيرًا من عمليات نشر الذكاء الاصطناعي تُبرَّر على أساس الكفاية لا التفوق. فإذا بدا نموذج أرخص أو أصغر جيدًا بما يكفي في المحادثة، فقد يؤدي أداءً أسوأ بكثير عندما يُعهد إليه باتخاذ قرارات أو التفاوض نيابة عن المستخدم.

السؤال التنظيمي حاضر بالفعل

إن حديث Anthropic عن “عدم المساواة غير المرئية” يجب أن يجد صدى يتجاوز هذه التجربة وحدها. فإذا نشرت المؤسسات فئات مختلفة من وكلاء الذكاء الاصطناعي عبر شرائح الموظفين أو فئات العملاء أو الخدمات العامة، فقد تخلق معاملة غير متكافئة من دون إشارات واضحة إلى الظلم عند نقطة الاستخدام.

وهذا تحدٍ في الحوكمة أصعب من مجرد الشفافية. فإخبار المستخدمين بأن الذكاء الاصطناعي كان حاضرًا لا يجيب عن سؤال ما إذا كان ذلك الذكاء بنفس كفاءة الذكاء الذي استُخدم مع شخص آخر. وعندما لا تزال التجربة بالنسبة للمستخدم تبدو عادلة، قد لا تتعرض السوق أو المؤسسة لضغط فوري لتصحيح الاختلال.

لذلك تبدو Project Deal كإنذار مبكر. فهي تشير إلى أن الوصول إلى الذكاء الاصطناعي لا يتعلق فقط بما إذا كان الشخص يحصل على مساعد رقمي، بل أيضًا بأي مساعد يحصل عليه، ومدى قدرته عندما تكون النتيجة ذات تبعات.

  • أجرت Anthropic سوقًا داخلية لمدة أسبوع على Slack باستخدام وكلاء Claude لإتمام معاملات حقيقية.
  • حقق Claude Opus 4.5 أسعارًا أفضل وصفقات أكثر في المتوسط من Claude Haiku 4.5.
  • المستخدمون الذين مثّلهم وكلاء أضعف لم يدركوا أنهم في وضع أسوأ، رغم أن نتائجهم كانت أضعف.

هذه المقالة مستندة إلى تغطية The Decoder. اقرأ المقال الأصلي.

Originally published on the-decoder.com