مقياس الذكاء الاصطناعي الداخلي لدى أمازون أنتج السلوك الخاطئ
أفادت تقارير بأن أمازون سحبت نظام ترتيب داخلي للذكاء الاصطناعي بعد أن تعلّم الموظفون كيف يصعدون في القائمة عبر توجيه أدوات الذكاء الاصطناعي إلى مهام لا طائل منها. وتعد هذه الواقعة دراسة حالة مفيدة حول الكيفية التي يمكن بها لمقاييس تبني الذكاء الاصطناعي التي تُطلق بسرعة أن تشوه الحوافز داخل الشركات الكبيرة.
وفقا للنص المصدر المرفق، استخدمت الشركة لوحة معلومات تُعرف باسم “Kirorank” لتقييم الموظفين بناء على نشاطهم على منصة التطوير Kiro التابعة لأمازون. وكان الهدف من المقياس تشجيع الاستخدام، لكن بعض العاملين بدأوا باستخدام الذكاء الاصطناعي من أجل الدرجة نفسها لا من أجل مخرجات ذات معنى. والنتيجة كانت أرقاما أعلى في النشاط، وتكاليف سحابية إضافية، مع القليل من الدلائل على قيمة مقابلة.
عندما يصبح الاستخدام هو الهدف
الإخفاق الأساسي مألوف في تصميم المؤسسات: ما إن يصبح المقياس هدفا حتى يبدأ الناس في تحسين المقياس نفسه بدلا من الهدف الأصلي. في هذه الحالة، كان الهدف الظاهري هو تبني مفيد للذكاء الاصطناعي من جانب المطورين. أما المؤشر البديل المختار فكان النشاط على منصة داخلية.
وقد ثبت أن هذا الفرق مكلف. فإذا كان بإمكان الموظفين تحسين موقعهم بمجرد تشغيل مزيد من المهام المعتمدة على الذكاء الاصطناعي، فقد يرتفع استهلاك الرموز وحركة المنصة حتى لو لم تتحسن جودة الشفرة أو سرعة التسليم أو أثرها على العملاء. ويقول النص المصدر إن بعض العاملين وجّهوا وكلاء الذكاء الاصطناعي إلى أعمال بلا معنى فقط لتحسين ترتيبهم.
ونُقل عن نائب الرئيس الأول Dave Treadwell قوله للموظفين: “Please don’t use AI just for the sake of using AI.” وهذه العبارة تلخص المشكلة الجوهرية بدقة. فعندما تضطر الإدارة إلى قول ذلك صراحة، يكون إطار القياس قد ابتعد بالفعل عن نتيجة الأعمال التي كان من المفترض أن يدعمها.
الضغط وراء لوحة المعلومات
التوقيت مهم. فقد حددت أمازون هدفا يتمثل في استخدام أكثر من 80% من مطوريها للذكاء الاصطناعي أسبوعيا، وفقا للنص المصدر. كما تخطط لإنفاق نحو 200 مليار دولار في عام 2026، معظمها على بنية تحتية للذكاء الاصطناعي. وتساعد هذه الأرقام على تفسير سبب الاهتمام الكبير بمقاييس التبني الداخلية.
الشركات الكبيرة التي تستثمر بهذه القوة في الذكاء الاصطناعي تريد دليلا على أن الأدوات تُستخدم، وتريد هذا الدليل بسرعة. تعد لوحات المعلومات استجابة إدارية بديهية لأنها تحول أجندة تحول واسعة إلى رقم مرئي. لكن الرؤية ليست مرادفة للفائدة. ففي مؤسسات البرمجيات على وجه الخصوص، يصعب التقاط التبني الحقيقي من خلال إحصاءات الاستخدام الخام.
ويشير النص المصدر إلى أن Meta شهدت نمطا مشابها، حيث سعى الموظفون وراء درجات استخدام الذكاء الاصطناعي. وهذا يوحي بأن المشكلة ليست خاصة بأمازون. فقد تكون بنيوية عبر الشركات التي تحاول تسريع تبني الذكاء الاصطناعي قبل أن تمتلك طرقا ناضجة لقياس المكاسب الفعلية.
من أعداد الرموز إلى النشر المفيد
المقياس البديل لدى أمازون لافت للنظر. فبدلا من تتبع استهلاك الرموز الخام، أصبحت الشركة تقيّم ما يسمى “normalized deployments”، أي الشفرة المولدة بالذكاء الاصطناعي والتي تثبت أنها مفيدة بالفعل. ويشير هذا التحول إلى الابتعاد عن مقاييس المدخلات نحو مقاييس المخرجات.
الخطوة منطقية، لكنها ليست بسيطة. فقياس ما إذا كانت الشفرة المولدة بالذكاء الاصطناعي مفيدة حقا يتطلب تعريفا أقوى للنجاح من مجرد تسجيل أن نموذجا ما تم استدعاؤه. وهذا يوحي بارتباط أوثق بنتائج الإنتاج، أو بالاندماج في سير العمل الحقيقي، أو بنوع من التحقق من أن العمل المولد أسهم فعلا في عملية نشر بدلا من أن يضيف ضوضاء.
ومع ذلك، فإن أي مقياس بديل سيحتاج إلى تصميم دقيق. فإذا جرى مكافأة الموظفين فقط على عدد عمليات النشر، فقد يحسنون أداءهم عبر عمليات صغيرة أو منخفضة المخاطر. وإذا كوفئوا على حجم الشفرة، فقد يولدون أكثر مما يراجعون بشكل مناسب. والخلاصة ليست أن المقاييس مستحيلة، بل إن مقاييس تبني الذكاء الاصطناعي تحتاج إلى مواءمة أدق مع القيمة الهندسية الحقيقية مما تفترضه كثير من المؤسسات في البداية.
لماذا يهم هذا الذكاء الاصطناعي المؤسسي
تُظهر تجربة أمازون أن عمليات نشر الذكاء الاصطناعي الداخلية تدخل مرحلة أصعب. فالتحدي الأول كان إيصال الأدوات إلى أيدي الموظفين. أما التحدي التالي فهو إثبات أن هذه الأدوات تحسن العمل الحقيقي بدلا من مجرد تضخيم مخططات التفاعل. ومع توسع الإنفاق على الذكاء الاصطناعي، من المرجح أن تنخفض قابلية التنفيذيين للتسامح مع التبني الرمزي.
وهذا مهم بشكل خاص في بيئات التطوير، حيث تتحول الحوسبة المهدرة مباشرة إلى تكلفة، وحيث يمكن للمخرجات المولدة منخفضة الجودة أن تخلق أعباء صيانة خفية لاحقا. يمكن للوحة ترتيب أن تحفز التجربة، لكنها قد تشجع أيضا على سلوك استعراضي إذا كان نظام التقييم سطحيا.
والخلاصة الأوسع بسيطة: لا يمكن للمؤسسات أن تعامل استخدام الذكاء الاصطناعي بحد ذاته على أنه النهاية. عليها التمييز بين النشاط والفعالية. ويشير قرار أمازون بإلغاء لوحة الترتيب إلى أن الشركة تعلمت ذلك الدرس بالطريقة المكلفة. وبالنسبة للمؤسسات الأخرى التي تدفع موظفيها نحو أدوات الذكاء الاصطناعي، فهذه رسالة تحذير بأن حملات التبني تحتاج إلى حوافز أفضل قبل أن توسع السلوك الخاطئ.
هذه المقالة تستند إلى تقرير من The Decoder. اقرأ المقال الأصلي.
Originally published on the-decoder.com


