قصة Anthropic في الأمن السيبراني تواجه ضغط الاستنساخ
قدّمت Anthropic نموذج Claude Mythos بوصفه نموذجًا مضبوطًا بإحكام للأمن السيبراني، وبقدرات قوية بما يكفي لتبرير تقييد الوصول إليه. ووفقًا للنص المصدر المرفق، حدّت الشركة من إتاحة Mythos Preview عبر Project Glasswing ليكون متاحًا لاتحاد يضم 11 منظمة، مستندةً إلى إمكاناته الهجومية. وتشير اختبارات داخلية ومراجعة أجراها معهد أمان الذكاء الاصطناعي في المملكة المتحدة إلى أن النموذج كان قادرًا على العثور على أخطاء برمجية، وبناء استغلالات عاملة بشكل مستقل، والسيطرة على شبكات شركات كاملة في محاكاة، شريطة أن تكون تلك الشبكات صغيرة وضعيفة الحماية ومعرّضة للخطر.
هذه مجموعة ادعاءات جدية، والتطور الجديد ليس أن هذه الادعاءات قد نُقضت. بل إن أجزاء من سردية التفرد باتت موضع تحدٍّ. وتشير محاولتا استنساخ مستقلتان وُصفتا في المصدر إلى أن النماذج الأصغر والأكثر انفتاحًا يمكنها إعادة إنتاج جزء كبير من تحليل الثغرات الذي عرضته Anthropic علنًا.
وهذا التمييز مهم. فالنقاش ينتقل من سؤال ما إذا كان Mythos قادرًا إلى سؤال ما إذا كانت القدرات المعروضة فريدة حقًا.
ما الذي وجدته محاولات الاستنساخ
جاءت محاولة الاستنساخ الأولى من AISLE، وهي شركة تعمل على صيد الثغرات بمساعدة الذكاء الاصطناعي في البرمجيات مفتوحة المصدر منذ منتصف 2025. ويقول المصدر إن AISLE أبلغت عن 15 ثغرة في OpenSSL وخمس ثغرات في curl. ويُذكر أن المؤسس Stanislav Fort استخدم مقتطفات برمجية من العينات العامة التي نشرتها Anthropic لاختبار مدى ما يمكن أن تصل إليه مجموعة من النماذج الأصغر والأكثر انفتاحًا جزئيًا بشكل مستقل.
أما المحاولة الثانية فجاءت من Vidoc Security، التي جمعت بين GPT-5.4 وClaude Opus 4.6 مع وكيل الترميز المفتوح OpenCode. وتسعى هذه الدراسات معًا إلى الإجابة عن سؤال عملي: عندما تعرض Anthropic قدرة مبهرة على العثور على الأخطاء أو على الاستدلال حول الاستغلال، فما مقدار هذا الأداء الذي يظل حكرًا على Mythos، وما مقدارُه الذي يعكس حدودًا قدرية للقدرات بدأت تتوسع عبر مشهد النماذج كله؟
ويبدو أن الإجابة الأولية في النص المصدر هي أن هذه الحدود قد تكون أوسع مما توحي به ضوابط الوصول لدى Anthropic.




