تتجه ميتا إلى الداخل بحثًا عن مصدر جديد لبيانات تدريب الذكاء الاصطناعي

تقول ميتا إنها ستجمع حركات الفأرة ونقرات الأزرار ومدخلات المستخدم الأخرى من موظفيها على بعض التطبيقات ضمن جهود تدريب نماذج الذكاء الاصطناعي. وشرح الشركة عملي: إذا كانت تريد بناء وكلاء يساعدون الناس على إنجاز المهام اليومية على الحواسيب، فالنماذج تحتاج إلى أمثلة على كيفية استخدام البشر للواجهات فعليًا، والتنقل عبر القوائم، وتنفيذ الأفعال داخل بيئات برمجية مختلفة.

في الظاهر، هذا التبرير سهل الفهم. فالنظام الذي يُراد له أن يتصرف على الحاسوب يحتاج إلى آثار سلوكية لا تُظهر فقط ما هي المهمة، بل كيف ينجزها الإنسان. ومع ذلك، فإن الخطوة لافتة لأنها تبرز تحولًا أوسع في صناعة الذكاء الاصطناعي. لم تعد بيانات التدريب مقتصرة على النصوص العامة أو الوسائط المرخصة أو مجموعات البيانات الموسومة التقليدية. بل إن المادة الخام لتطوير النماذج تشمل بصورة متزايدة سجلات العمل البشري نفسه.

ما الذي تقول ميتا إنها تجمعه

وفقًا للنص الأصلي، قدمت ميتا بيانًا قالت فيه إنها ستطلق أداة داخلية تلتقط «هذا النوع من المدخلات» على بعض التطبيقات. ووصفت الشركة الغرض بأنه تدريب نماذج لوكلاء يمكنهم مساعدة الناس على إنجاز مهام الحاسوب اليومية. كما قالت ميتا إن هناك ضمانات لحماية المحتوى الحساس وأن البيانات لا تُستخدم لأي غرض آخر.

هذه الصياغة مهمة. فالبيان يركز على بيانات التفاعل لا على المراقبة الأوسع، لكنه لا يزال يصف نظامًا يحول السلوك الروتيني في مكان العمل إلى مادة تدريبية. قد تبدو النقرات وحركات المؤشر وأنماط التنقل بسيطة على حدة، لكنها مجتمعة ترسم خريطة غنية لكيفية إنجاز العمل في الأنظمة الرقمية.

هذا النوع من البيانات يمكن أن يكون ذا قيمة لأنه يلتقط الطبقة الإجرائية للحوسبة. تستطيع نماذج اللغة الكبيرة بالفعل توليد نصوص عن مهام البرمجيات. لكنها غالبًا ما تفتقر إلى الأدلة السلوكية المتجذرة التي توضح الأنماط خطوة بخطوة التي يتبعها البشر داخل الواجهات الحقيقية. استخدام الموظفين الداخلي يوفر ذلك بالضبط.

لماذا تبحث صناعة الذكاء الاصطناعي عن مدخلات جديدة

يضع التقرير قرار ميتا في سياق سباق أوسع على بيانات التدريب. ومع ازدياد قدرات أنظمة الذكاء الاصطناعي، تبحث الشركات عن مصادر أكثر تخصصًا في المهام، وأكثر حداثة، وأشد ارتباطًا بالسلوك الواقعي. وبالنسبة للأنظمة المصممة لتعمل كوكلاء رقميين، فإن النص وحده لا يكفي. يحتاج المطورون إلى سجلات للتفاعلات مع الواجهات الرسومية، والنماذج، والأزرار، والقوائم المنسدلة، وسير العمل عبر تطبيقات متعددة.

وهذا يفسر لماذا يصبح النشاط الداخلي في الشركات جذابًا. فالشركات تحتوي أصلًا على كميات كبيرة من السلوك التشغيلي: ملاحظات الاجتماعات، وسجلات الدعم، وتواريخ المشاريع، وأنماط استخدام البرمجيات، وأرشيفات التواصل. ويشير النص الأصلي إلى مثال حديث آخر جرى فيه، بحسب التقارير، استخراج اتصالات داخلية من شركات ناشئة قديمة مثل أرشيفات Slack وتذاكر Jira، والتي يمكن إعادة توظيفها كوقود للذكاء الاصطناعي. النمط واضح. المعلومات التي أُنشئت ذات يوم للتعاون يُعاد النظر فيها الآن باعتبارها مدخلات للنماذج.

ويختلف نهج ميتا في أنه لا يكتفي بجمع السجلات التاريخية، بل يلتقط بيانات التفاعل الحية من الموظفين لدعم طموح منتج محدد.

الهدف الاستراتيجي: وكلاء أفضل لاستخدام الحواسيب

يشير بيان ميتا مباشرة إلى فئة المنتج محل الرهان: وكلاء ذكاء اصطناعي يمكنهم مساعدة المستخدمين على إنجاز المهام اليومية على الحواسيب. وهذه جبهة مهمة في الصناعة. فالفرق بين روبوت محادثة يشرح سير العمل ووكيل ينفذه فرق هائل. ولعبور هذه الفجوة، تحتاج الشركات إلى نماذج لا تفهم اللغة فحسب، بل تفهم أيضًا سلوك الواجهات.

قد يساعد التدريب على حركات الفأرة والنقرات النماذج على تعلم تسلسلات الأفعال الشائعة، والوظائف المحتملة للواجهة، ونقاط القرار التي يواجهها البشر أثناء التعامل مع التطبيقات. بعبارة أخرى، يبدو أن الشركة تجمع الأساس السلوكي اللازم لأتمتة أقل تجريدًا وأكثر تشغيلية.

ولهذا أيضًا فإن هذه الخطوة أكبر من مجرد تحديث لأداة داخلية. إنها دليل على كيفية توقع الشركات أن تتنافس الجيل التالي من أنظمة الذكاء الاصطناعي: ليس فقط بجودة المحادثة، بل بقدرتها على التصرف داخل بيئات البرمجيات.

مشكلة الخصوصية والحوكمة

المنطق نفسه الذي يجعل هذه البيانات مفيدة يجعلها أيضًا حساسة. فالتفاعلات في مكان العمل ليست مخلفات محايدة. يمكنها أن تكشف العادات، والأولويات، والأخطاء، وأنماط الوصول، وفي بعض الحالات لمحات من معلومات حساسة. وحتى إذا قيّدت ميتا الجمع ببعض التطبيقات وقالت إن هناك ضمانات، فإن القرار يطرح سؤالًا في الحوكمة لن يقتصر على شركة واحدة: إلى أي مدى يمكن إعادة استخدام نشاط الموظفين العادي لتدريب النماذج قبل أن يصبح من الصعب الفصل بين المراقبة في مكان العمل وتطوير المنتج؟

المسألة لا تتعلق فقط بما إذا كان المحتوى الخاص مكشوفًا أم لا. بل تتعلق أيضًا بالموافقة، والنطاق، والسابقة. فعندما يُعامل سلوك المستخدم داخل أنظمة المؤسسة على أنه مادة تدريبية، قد تجد المؤسسات نفسها مضطرة إلى وضع قواعد رسمية بشأن أنواع آثار العمل التي يمكن التقاطها، ومدة الاحتفاظ بها، وما إذا كان لدى العاملين رأي فعلي في المشاركة. والنص الأصلي لا يجيب عن هذه الأسئلة، لكنه يوضح لماذا أصبحت ملحّة.

إشارة إلى اتجاه تطوير الذكاء الاصطناعي

توضح أداة جمع البيانات الداخلية لدى ميتا حقيقة أوسع بشأن سباق الذكاء الاصطناعي الحالي. فالصناعة تتحرك أبعد من الحقبة التي كان فيها تقدم النماذج يعتمد أساسًا على جمع المزيد من النصوص على نطاق الإنترنت. ومن المرجح أن تأتي القفزات التالية من بيانات أضيق، وأكثر سلوكية، وأكثر ارتباطًا بمهام محددة. وهذا يغير كلًا من الدليل التقني والعقد الاجتماعي المحيط باستخدام البيانات.

بالنسبة إلى ميتا، قد تكون الفائدة القريبة هي تدريب أفضل لأنظمة تعمل على تشغيل الحواسيب بكفاءة أكبر. أما بالنسبة للسوق الأوسع، فالإعلان مجرد إشارة أخرى إلى أن السلوك الرقمي اليومي يُعاد تعريفه باعتباره بنية تحتية استراتيجية للذكاء الاصطناعي.

وقد يكون هذا في النهاية هو الاستنتاج الأهم. فمستقبل تدريب الذكاء الاصطناعي لن يتشكل فقط بما يقوله الناس أو يكتبونه على الإنترنت. بل سيتشكل أيضًا بكيفية تنقلهم داخل البرمجيات، واتخاذهم القرارات على الشاشات، وإنجازهم روتين العمل الرقمي. لقد جعلت ميتا هذا التحول واضحًا على نحو غير معتاد. ومن المرجح أن تراقب بقية الصناعة الأمر عن كثب، لما يتيحه من مزايا تقنية وما يكشفه من مخاطر حوكمة.

هذه المقالة تستند إلى تقرير من TechCrunch. اقرأ المقال الأصلي.

Originally published on techcrunch.com