يتم توجيه نموذج متقدم أولاً نحو الدفاع

تقول Anthropic إنها تتيح نسخة تجريبية من نموذج ذكاء اصطناعي جديد لتحالف من مؤسسات التكنولوجيا والأمن في إطار جهد للأمن السيبراني يهدف إلى العثور على نقاط الضعف في البنية التحتية البرمجية الحرجة قبل أن يفعل ذلك المهاجمون.

تجمع المبادرة، المسماة Project Glasswing، شركات ومنظمات تشمل Amazon وApple وBroadcom وCisco وCrowdStrike وLinux Foundation وMicrosoft وPalo Alto Networks. وقالت Anthropic إن النموذج سيُستخدم في أعمال الأمن الدفاعي، وإن النتائج ستُشارك على نطاق أوسع عبر الصناعة.

تعكس هذه الخطوة توتراً متزايداً في قلب تطوير الذكاء الاصطناعي. فالنماذج الأكثر قدرة قد تزيد من خطر إساءة الاستخدام السيبراني الهجومي، لكنها قد تمنح المدافعين أيضاً أدوات جديدة لاكتشاف الثغرات على نطاق وعمق يصعب على الاختبارات التقليدية مجاراته.

ما تقول Anthropic إن النموذج يستطيع فعله

وفقاً للتقرير، اكتشفت Anthropic تطبيقات أمنية قوية أثناء تدريب ما أطلقت عليه “Claude Mythos Preview” لمهام البرمجة والاستدلال. وقالت الشركة إن النموذج حدّد بالفعل آلاف الثغرات من نوع اليوم الصفري خلال الأسابيع الأخيرة، وكثير منها كان بالغ الخطورة.

ومن بين الأمثلة التي ذكرتها Anthropic خطأ عمره 27 عاماً في OpenBSD وثغرة عمرها 16 عاماً في برنامج فيديو واسع الاستخدام لم تتمكن أدوات الاختبار الآلي من العثور عليها. كما وصفت الشركة اختبارات داخلية على 1,000 مستودع مفتوح المصدر، أظهر فيها Mythos Preview نتائج تعطل أكثر خطورة بكثير من النماذج السابقة.

وفي وصف Anthropic، أنتج الجيل السابق كثيراً من الأعطال منخفضة المستوى وتعطلًا واحداً فقط من المستوى 3، بينما ولّد Mythos Preview 595 حالة تعطل عبر المستويين 1 و2، وعدداً محدوداً في المستويين 3 و4، إضافة إلى استيلاء كامل على تدفق التحكم في 10 أهداف تم ترقيعها بالكامل. وقالت Anthropic إن النموذج لم يُدرّب خصيصاً على تنفيذ تلك الاستغلالات، وإن هذه القدرة ظهرت نتيجة تحسن أوسع في البرمجة والاستدلال والسلوك المستقل.

لماذا يتركز الاهتمام على البرمجيات الحرجة

يركز Project Glasswing على البنية التحتية البرمجية الحرجة لأن العيوب في الأسس واسعة الاستخدام يمكن أن تمتد آثارها إلى الحكومات والشركات والنظم البيئية للمصادر المفتوحة. وقالت Anthropic إنها توسع الوصول إلى ما هو أبعد من مجموعة الشركاء الأولى ليشمل نحو 40 منظمة إضافية تبني البرمجيات الحرجة أو تحافظ عليها.

كما تلتزم الشركة بما يصل إلى 100 مليون دولار في أرصدة استخدام النموذج و4 ملايين دولار في تبرعات مباشرة لمنظمات أمن المصادر المفتوحة. وتشير هذه الحزمة إلى جهد لا يقتصر على إثبات قدرة النموذج، بل يهدف أيضاً إلى إنشاء سير عمل دفاعي حول البرمجيات التي تقوم عليها أجزاء كبيرة من الاقتصاد الرقمي.

إذا تمكن النموذج من تحديد الثغرات التي صمدت لسنوات داخل قواعد برمجية ناضجة بشكل موثوق، فقد تكون قيمته الأعلى في الأماكن التي تكون فيها البرمجيات أقدم وأكثر ثقة والأصعب في التدقيق الشامل باستخدام الأدوات الحالية.

الطابع ذو الحدين للذكاء الاصطناعي الأقوى

يأتي هذا الإعلان وسط قلق متزايد من أن النماذج المتقدمة قد تجعل الهجمات السيبرانية أكثر تعقيداً. واعترفت Anthropic بهذه المعضلة مباشرة، مجادلة بأن قدرات الحدود قد تتقدم بشكل كبير خلال الأشهر المقبلة، وأن المدافعين يحتاجون إلى التحرك بسرعة إذا أرادوا مجاراة هذا التطور.

هذا التأطير مهم. فـAnthropic لا تقدم النموذج بوصفه مجرد أداة إنتاجية لباحثي الأمن، بل تقدمه باعتباره جزءاً من سباق بين القدرة الهجومية والدفاعية، وهو سباق قد يفيد فيه التأخير المهاجمين.

هناك أيضاً حجة سياسية ضمنية في بنية الإصدار. فالنسخة التجريبية محدودة، وليست متاحة على نطاق عام، ومرتبطة بمهمة أمنية محددة. وهذا يشير إلى أن Anthropic تحاول إظهار مسار نشر مضبوط للأنظمة عالية القدرة في المجالات التي تكون فيها الفائدة كبيرة، لكن احتمال سوء الاستخدام فيها مرتفع على نحو غير معتاد.

نموذج ناشئ لنشر أمن الذكاء الاصطناعي

قد تكون المبادرة مهمة حتى خارج نظام Anthropic نفسه. إذا نجح Project Glasswing، فقد يصبح قالباً لكيفية إدخال مختبرات الذكاء الاصطناعي المتقدمة للقدرات الحساسة: وصول محدود، شركاء موثوقون، استخدام محكوم بالمهمة، وتوقع أن تُشارك النتائج على نطاق أوسع بدلاً من احتكارها.

وقالت Anthropic أيضاً إنها كانت في محادثات مستمرة مع مسؤولين في الحكومة الأمريكية بشأن القدرات السيبرانية الهجومية والدفاعية للنموذج. وتشير هذه التفاصيل إلى واقع آخر بات يشكل القطاع: لم يعد الأمن السيبراني تطبيقاً جانبياً لمختبرات الذكاء الاصطناعي المتقدمة، بل أصبح بسرعة أحد الاختبارات الأساسية لكيفية حوكمة هذه الأنظمة وتقييمها ودمجها في البنية التحتية الحرجة.

حتى الآن، موقف الشركة واضح. فهي تعتقد أن قدرة فئة Mythos يمكن أن تعزز الدفاع البرمجي بصورة ملموسة، وتحاول إثبات هذه الفرضية بالشراكة مع بعض أكبر المؤسسات في عالم التكنولوجيا.

ما الذي يجب مراقبته بعد ذلك

ستكون المرحلة التالية أهم من العنوان الرئيسي. والأسئلة الجوهرية هي ما إذا كانت المنظمات الشريكة ستؤكد ادعاءات Anthropic في سير عمل واقعي، وما إذا كانت الثغرات التي يتم اكتشافها ستُصلح وتُفصح عنها بفعالية، وما إذا كان من الممكن إبقاء الفئة نفسها من النموذج متوافقة مع الاستخدام الدفاعي مع استمرار تحسن القدرات.

قضت شركات الذكاء الاصطناعي العامين الماضيين وهي تجادل بأن أنظمتها ستعيد تشكيل البرمجة. ويختبر Project Glasswing فرضية أضيق وأصعب: ما إذا كان بإمكانها إعادة تشكيل أمن البرمجيات بطرق تقلل المخاطر بشكل ملموس قبل أن يلحق الخصوم بالركب.

هذه المقالة مبنية على تقرير من Fast Company. اقرأ المقال الأصلي.