نماذج مفتوحة تعيد إنتاج عروض Anthropic الأمنية حول Mythos، وفق دراسات

قصة Anthropic في الأمن السيبراني تواجه ضغط الاستنساخ

قدّمت Anthropic نموذج Claude Mythos بوصفه نموذجًا مضبوطًا بإحكام للأمن السيبراني، وبقدرات قوية بما يكفي لتبرير تقييد الوصول إليه. ووفقًا للنص المصدر المرفق، حدّت الشركة من إتاحة Mythos Preview عبر Project Glasswing ليكون متاحًا لاتحاد يضم 11 منظمة، مستندةً إلى إمكاناته الهجومية. وتشير اختبارات داخلية ومراجعة أجراها معهد أمان الذكاء الاصطناعي في المملكة المتحدة إلى أن النموذج كان قادرًا على العثور على أخطاء برمجية، وبناء استغلالات عاملة بشكل مستقل، والسيطرة على شبكات شركات كاملة في محاكاة، شريطة أن تكون تلك الشبكات صغيرة وضعيفة الحماية ومعرّضة للخطر.

هذه مجموعة ادعاءات جدية، والتطور الجديد ليس أن هذه الادعاءات قد نُقضت. بل إن أجزاء من سردية التفرد باتت موضع تحدٍّ. وتشير محاولتا استنساخ مستقلتان وُصفتا في المصدر إلى أن النماذج الأصغر والأكثر انفتاحًا يمكنها إعادة إنتاج جزء كبير من تحليل الثغرات الذي عرضته Anthropic علنًا.

وهذا التمييز مهم. فالنقاش ينتقل من سؤال ما إذا كان Mythos قادرًا إلى سؤال ما إذا كانت القدرات المعروضة فريدة حقًا.

ما الذي وجدته محاولات الاستنساخ

جاءت محاولة الاستنساخ الأولى من AISLE، وهي شركة تعمل على صيد الثغرات بمساعدة الذكاء الاصطناعي في البرمجيات مفتوحة المصدر منذ منتصف 2025. ويقول المصدر إن AISLE أبلغت عن 15 ثغرة في OpenSSL وخمس ثغرات في curl. ويُذكر أن المؤسس Stanislav Fort استخدم مقتطفات برمجية من العينات العامة التي نشرتها Anthropic لاختبار مدى ما يمكن أن تصل إليه مجموعة من النماذج الأصغر والأكثر انفتاحًا جزئيًا بشكل مستقل.

أما المحاولة الثانية فجاءت من Vidoc Security، التي جمعت بين GPT-5.4 وClaude Opus 4.6 مع وكيل الترميز المفتوح OpenCode. وتسعى هذه الدراسات معًا إلى الإجابة عن سؤال عملي: عندما تعرض Anthropic قدرة مبهرة على العثور على الأخطاء أو على الاستدلال حول الاستغلال، فما مقدار هذا الأداء الذي يظل حكرًا على Mythos، وما مقدارُه الذي يعكس حدودًا قدرية للقدرات بدأت تتوسع عبر مشهد النماذج كله؟

ويبدو أن الإجابة الأولية في النص المصدر هي أن هذه الحدود قد تكون أوسع مما توحي به ضوابط الوصول لدى Anthropic.

How we used Gemini to build Google I/O 2026

تفصّل جوجل كيف ساعد Gemini في إنتاج I/O 2026

تقول جوجل إن فرقها استخدمت Gemini وأدوات ذكاء اصطناعي أخرى للمساعدة في إنشاء الأفلام والعناصر البصرية ومكونات الفعالية في Google I/O 2026، مقدمة المؤتمر بوصفه عرضاً داخلياً للإنتاج المدعوم بالذكاء الاصطناعي.

Read article

مثال FreeBSD هو حالة الاختبار الأساسية

أكثر الأمثلة تحديدًا في المادة المقدمة يتعلق بخطأ NFS في FreeBSD تم التعرف عليه باعتباره CVE-2026-4747. وكانت Anthropic قد أبرزت هذه الحالة بوصفها عرضًا لقدرة Mythos على الاكتشاف والاستغلال الذاتي. ثم اختبرت AISLE ثمانية نماذج على الدالة ذات الصلة، ووفقًا للمقال، اكتشف كل واحد منها خطأ الذاكرة.

هذا هو التحدي الأقوى في التقرير. لم يكتفِ كل النماذج الثمانية، بحسب ما ورد، بوصف العيب بأنه خطير، بل ولّدت أيضًا استدلالات مقنعة بشأن الاستغلال ولماذا لن تنطبق وسائل الحماية القياسية في نظام التشغيل. ويُذكر أن نموذجًا، GPT-OSS-120b، أنتج تسلسلًا من gadgets اعتبرته AISLE قريبًا من الاستغلال الحقيقي. كما يُقال إن Kimi K2 استنتج أن الهجوم قد ينتشر تلقائيًا من جهاز مصاب إلى أجهزة أخرى، وهي تفصيلة تقول المقالة إن Anthropic نفسها لم تذكرها.

إذا كانت هذه النتائج دقيقة، فهي تقوض فكرة أن تحديد هذا النوع من الثغرات وتحليلها أمر يختص به نموذج واحد شديد التحكم.

أين يبدو أن الفجوة لا تزال قائمة

في الوقت نفسه، لا يسوّي النص المصدر كل الفروق بين Mythos والنماذج المفتوحة الأصغر. فهو يشير إلى خطوة إبداعية أكثر صعوبة في سلسلة الاستغلال الحقيقية: ملاءمة حمولة يزيد حجمها على 1,000 بايت داخل نحو 304 بايت فقط من المساحة المتاحة. ووفقًا للمقال، نجح Mythos في ذلك عبر تقسيم الحمولة إلى 15 طلبًا شبكيًا منفصلًا. ولم تبلغ أي من محاولات الاستنساخ الموصوفة في النص الظاهر هذا المستوى من بناء الاستغلال.

وهذه الدقة مهمة. فهي تشير إلى أن الفجوة قد لا تكون بعد الآن في التعرف الأولي على الثغرات أو في الاستدلال عالي المستوى حول الاستغلال، بل في الهندسة الأصعب المطلوبة لتحويل ثغرة إلى هجوم قابل للتنفيذ بالكامل ضمن قيود صارمة.

بعبارة أخرى، لا تثبت دراسات الاستنساخ أن Mythos نموذج عادي. لكنها تشير إلى أن بعض الأمثلة البارزة المستخدمة لتبرير هالته قد تكون أقل فرادة مما بدت عليه في البداية.

OpenAI starts with infrastructure robots but aims for "everyone having a personal robot doing anything they need"

تعيد OpenAI بناء قسم الروبوتات حول أعمال البنية التحتية ورؤية استهلاكية أبعد مدى

أعادت OpenAI بناء فريق الروبوتات لديها، بدءًا بمهام البنية التحتية، بينما يصف الرئيس التنفيذي سام ألتمان هدفًا طويل الأمد يتمثل في روبوتات شخصية للجميع.

Read article

لماذا يهم هذا لسياسة أمن الذكاء الاصطناعي

تمتد الآثار إلى ما هو أبعد بكثير من خلاف بين موردي النماذج. فقيود الوصول وسياسات السلامة ومناقشات الأمن القومي تعتمد بدرجة متزايدة على ادعاءات حول أي الأنظمة تتجاوز عتبات القدرة بصورة ذات معنى. وإذا استطاعت النماذج الصغيرة أو المفتوحة جزئيًا إعادة إنتاج معظم العمل المعروض، فسيحتاج صناع السياسات والمختبرات إلى تعريف أدق لما يعد جديدًا ماديًا أو خطيرًا على نحو خاص.

وهذا أحد التوترات المركزية في حوكمة الذكاء الاصطناعي الحدّي. قد تكون الشركة صادقة في تقييد الوصول إلى نموذج قوي، لكن الأمثلة العامة التي تستخدمها لتبرير هذه القيود يمكن أن تُختبر سريعًا أمام منظومة مفتوحة تتحسن بسرعة. وعندما يحدث ذلك، لا يعود السؤال فقط عمّا إذا كان النموذج الرائد قويًا، بل عمّا إذا كانت القدرة المقيدة تنتشر بالفعل.

ويشير تأطير المقال إلى أن هذا هو بالضبط ما يحدث في أبحاث الأمن السيبراني المعززة بالذكاء الاصطناعي. فالقدرات التي بدت حديثًا استثنائية قد تصبح قابلة للاستنساخ الآن بتكلفة أقل وبقدر أكبر من الانفتاح مما ألمحت إليه بعض الشركات.

المعنى التنافسي لسوق النماذج

هناك أيضًا زاوية تجارية. يعتمد تموضع Anthropic حول Mythos جزئيًا على الاعتقاد بأنه يقع في طبقة نادرة من القدرة الهجومية في الأمن السيبراني. وإذا كانت النماذج المتاحة للجمهور أو شبه المفتوحة قادرة على محاكاة معظم العمل نفسه، فإن عرض القيمة يتغير.

هذا لا يمحو المزايا في الموثوقية أو العمق أو الأتمتة الشاملة. لكنه يضعف السردية القائلة إن نظامًا أو نظامين محميين فقط قادران على إجراء تحليل ذاتي ذي معنى للثغرات. وبالنسبة للمشترين والمقيّمين وباحثي الأمن، قد يسرّع ذلك ضغط القياس المعياري عبر مجموعة أوسع من النماذج.

وقد يعزز أيضًا دور الوكلاء وسلاسل الأدوات بدلًا من أوزان النموذج وحدها. فإحدى محاولات الاستنساخ الموصوفة في المصدر تجمع بين نماذج متقدمة ووكيل ترميز مفتوح، وهو تذكير بأن الأنظمة المركبة باتت لا تقل أهمية عن القدرة الخام لنموذج واحد.

دراسة تجد أن استخدام وكلاء البرمجة بالذكاء الاصطناعي غير متكافئ بشكل حاد عبر العلوم الاجتماعية

وجدت دراسة من Anthropic تفاوتات كبيرة في تبني وكلاء البرمجة عبر العلوم الاجتماعية، مع فجوات بحسب الجنس، والتخصص، والمرحلة المهنية، وترتيب الجامعة.

Read article

أسطورة أضيق، لا انهيار في القدرة

عنوان المقال المصدر حاد عن قصد، لكن الأدلة الموصوفة تدعم خلاصة أكثر دقة. فحكاية Mythos لا تنهار لأن النموذج يفتقر إلى القدرة. بل تتقلص لأن الأمثلة المستخدمة لتضخيم فرادته باتت تُطابق، على الأقل جزئيًا، من قبل بدائل أصغر وأكثر انفتاحًا.

ولا يزال هذا تطورًا كبيرًا. ففي الذكاء الاصطناعي، يعتمد المكانة كثيرًا على الإدراك المقارن بقدر ما تعتمد على الأداء المطلق. وإذا ضعفت هالة التفرد، يتغير النقاش الاستراتيجي.

وبالنسبة لقراء Developments Today، فإن الخلاصة الأساسية هي هذه: قد ينتشر حدّ القدرات في الذكاء الاصطناعي للأمن السيبراني أسرع مما تستطيع السرديات المؤسسية احتواءه. قد تكون Anthropic لا تزال تملك نظامًا قويًا. لكن إذا تمكنت مجموعات مستقلة من إعادة إنتاج جزء كبير من عملها المعروض علنًا باستخدام نماذج أرخص وأكثر انفتاحًا، فإن القصة الحقيقية لم تعد مجرد أداة استثنائية من مختبر واحد، بل عن فئة من القدرات أصبح احتكارها أصعب بكثير.

تعتمد هذه المقالة على تقرير The Decoder. اقرأ المقال الأصلي.

Originally published on the-decoder.com

النماذج المفتوحة تتحدى الهالة المحيطة بادعاءات Anthropic عن Mythos في الأمن السيبراني

قصة Anthropic في الأمن السيبراني تواجه ضغط الاستنساخ

ما الذي وجدته محاولات الاستنساخ

تفصّل جوجل كيف ساعد Gemini في إنتاج I/O 2026

مثال FreeBSD هو حالة الاختبار الأساسية

أين يبدو أن الفجوة لا تزال قائمة

تعيد OpenAI بناء قسم الروبوتات حول أعمال البنية التحتية ورؤية استهلاكية أبعد مدى

لماذا يهم هذا لسياسة أمن الذكاء الاصطناعي

المعنى التنافسي لسوق النماذج

دراسة تجد أن استخدام وكلاء البرمجة بالذكاء الاصطناعي غير متكافئ بشكل حاد عبر العلوم الاجتماعية

أسطورة أضيق، لا انهيار في القدرة

Comments (0)

Related Articles

Anthropic تمنع أدوات الذكاء الاصطناعي في المقابلات لاختبار المرشحين

Keep Reading