مقياس تقييم الأداء الجديد الذي لم يطلبه أحد
في مكان ما في أعماق إدارة الأداء الشركية، أتت فكرة لشخص ما: إذا كنا ندفع مقابل رموز الذكاء الاصطناعي، فيجب أن نكون قادرين على قياس من يستخدمها أكثر. وهكذا وُلد مقياس جديد في مكان العمل — استهلاك رموز الذكاء الاصطناعي كبديل للإنتاجية والمشاركة.
تظهر تقارير بأن بعض شركات التكنولوجيا، الحريصة على تبرير استثماراتها في منصات الذكاء الاصطناعي وتحديد المتبنين المبكرين، تراقب مدى سرعة استهلاك الموظفين لرموز نماذج اللغة الكبيرة. كلما زاد عدد الرموز المستهلكة، كلما زاد الانخراط في الذكاء الاصطناعي للعامل — أو هكذا يسير المنطق. إنه منطق إداري يبدو معقولاً على السطح حتى تفحصه لمدة ثلاثين ثانية تقريباً.
لماذا عد الرموز هو مقياس إنتاجية سيء
يقيس استهلاك الرموز استخدام الذكاء الاصطناعي، وليس مخرجات العمل. المطور الذي يستخدم Claude أو Copilot لتوليد خمس طرق بديلة لمشكلة برمجية قبل اختيار الأفضل يستهلك رموز أكثر بكثير من المطور الذي يكتب كوداً نظيفاً بشكل مستقل في المحاولة الأولى. بموجب مقياس استهلاك الرموز، يسجل المطور الأول درجة أعلى — حتى لو كان الثاني قد ينتج عملاً أفضل.
يعكس المقياس أيضاً هيكل الحوافز بطرق أخرى. الموظفون الذين يفهمون قيود الذكاء الاصطناعي ويستخدمونه بحذر سيستخدمون بشكل طبيعي رموزاً أقل من أولئك الذين يطرحون أسئلة بشكل متكرر على أمل الحصول على نتائج أفضل. يكافئ المقياس الحجم على التمييز.
هناك أيضاً مشكلة اللعب الواضحة. بمجرد أن يعرف الموظفون أنهم يتم تقييمهم على استخدام الرموز، سيولدون الأسئلة. الكثير من الأسئلة. أسئلة بلا معنى إذا لزم الأمر. التاريخ الشركي مليء بأمثلة على المقاييس التي كانت سهلة اللعب وسرعان ما أصبحت المخرجات الأساسية التي كانت من المفترض أن تقيسها.
المشكلة الأعمق: قياس تبني الذكاء الاصطناعي بالطريقة الخاطئة
الدافع وراء هذه المقاييس ليس خاطئاً تماماً. المنظمات التي استثمرت بكثافة في منصات الذكاء الاصطناعي تريد أن تعرف ما إذا كانت هذه الاستثمارات تحقق عوائد. تحديد الموظفين الذين لا يستخدمون الأدوات المتاحة — وفهم السبب — هو مصدر قلق إداري مشروع.
لكن استهلاك الرموز هو مؤشر رائد في أحسن الأحوال، ومضلل في أسوأ الأحوال. ما يهم حقاً هو ما إذا كان الذكاء الاصطناعي يغير مخرجات العمل: تقليل وقت إنجاز المهام، تحسين الجودة، تمكين العمل الذي لم يكن ممكناً سابقاً، أو تحرير السعة المعرفية للأنشطة ذات القيمة الأعلى. لا يتم التقاط أي من هذه من خلال عد استدعاءات API.
الشركات المزعومة التي تستخدم هذا النهج تقيس بشكل أساسي المدخلات لأن المخرجات أصعب في التحديد والقياس. هذا مفهوم في فترة انتقالية، لكن معاملة المقياس البديل كشيء حقيقي هو فشل إداري له تاريخ طويل في التكنولوجيا.
ما يكشفه هذا عن تكامل الذكاء الاصطناعي
يعكس ظهور مقاييس استهلاك الرموز قلقاً أوسع في منظمات التكنولوجيا: الشعور بأن الذكاء الاصطناعي يحول العمل بشكل أسرع من قدرة أطر الإدارة على التكيف. القادة الذين يفهمون أن الذكاء الاصطناعي مهم لكنهم لم يملكوا بعد أطراً واضحة لقياس تأثيره التنظيمي يسعون إلى أي أرقام متاحة.
هذه المرحلة كانت يمكن التنبؤ بها وربما مؤقتة. نفس النمط حدث مع مقاييس اعتماد السحابة، ونقاط سرعة Agile، والعديد من الانتقالات التكنولوجية الأخرى. في النهاية تطور المنظمات طرقاً أكثر تطوراً لقياس التأثير بعد أن يفرض دورة الضجيج الأولي بعض التفكير الأعمق.
تحدي الإدارة في عصر الذكاء الاصطناعي
الحقيقة الأصعب هي أن الذكاء الاصطناعي يعقد بشكل أساسي نسب مخرجات العمل. عندما ينتج المطور كوداً، فكم من الفضل يجب أن ينسب إليه مقابل الذكاء الاصطناعي الذي صاغه؟ عندما يسلم المصمم مفهوماً، كيف تقيم الحكم الإبداعي البشري المطبق على الخيارات التي ولدها الذكاء الاصطناعي؟ عندما ينشر الكاتب مقالة، أين تنتهي المساعدة في البحث وتبدأ المساهمة الإبداعية؟
هذه الأسئلة ليس لها إجابات نظيفة، وهذا هو السبب في أن المنظمات تسعى إلى مقاييس أبسط مثل استهلاك الرموز. لكن الشركات التي تتمكن من معرفة كيفية قياس العمل المحسّن بالذكاء الاصطناعي بدقة — بدلاً من مجرد قياس استخدام الذكاء الاصطناعي — ستتمتع بميزة كبيرة في تخصيص المواهب وهيكلة الحوافز وبناء فرق تستخدم الذكاء الاصطناعي بفعالية.
حتى ذلك الحين، توقع المزيد من المقاييس المريبة، والمزيد من ارتباك الموظفين، والمزيد من المقالات التي تشرح لماذا عد الرموز ليس نفس عد العمل الجيد.
تستند هذه المقالة إلى التقارير من Gizmodo. اقرأ المقالة الأصلية.
Originally published on gizmodo.com


