اختراق رياضي مزعوم آخر من الذكاء الاصطناعي يصل سريعًا

تتسارع الدورة التنافسية في رياضيات الذكاء الاصطناعي المتقدمة. وبعد وقت قصير من ادعاء OpenAI أنها دحضت حدسية إردوش للمسافة الواحدة، يقول موظفون في Anthropic الآن إن Claude Mythos يمكنه حل المشكلة نفسها أيضًا، وفقًا لـ The Decoder.

ويظل الادعاء، على وجه الدقة، مجرد نتيجة منقولة كما وصفها موظفو Anthropic ونوقشت علنًا على X. وهذا مهم لأنه يضع القصة ضمن فئة أصبحت شائعة بشكل متزايد في أبحاث الذكاء الاصطناعي المتقدمة: التقدم التقني المهم يُتداول أولًا داخل المختبرات وبين المهندسين والرياضيين العاملين قبل أن يحسمه بحث مؤسسي كامل أو تحقق مستقل أوسع.

ومع هذا التحفظ، يظل التطور المنقول مهمًا. فحدسية إردوش للمسافة الواحدة مفتوحة منذ عام 1946. وإذا كانت عدة أنظمة متقدمة قادرة الآن على إيجاد مسارات حل قابلة للتطبيق لمشكلة قديمة في الهندسة التركيبية، فالقصة لم تعد مجرد برهان واحد لافت للانتباه. بل أصبحت احتمال أن النماذج المتقدمة بدأت تُظهر قيمة قابلة للتكرار في مشكلات بحثية صعبة.

ما الذي فعلته Anthropic، بحسب ما نُقل

بحسب النص المصدر، استخدمت Anthropic إعداد اختبار بُني بعد أن حل الذكاء الاصطناعي مشكلة أخرى لإردوش. وكان النظام يتضمن مثيلات معزولة من Claude Code مع وصول إلى Mythos، تتلقى المشكلة، وتستكشف مسارات الحل، ثم تنقل النتائج الموجزة إلى مثيلات أخرى تعمل بشكل مستقل. وهذه التفاصيل مهمة لأنها تنقل النقاش بعيدًا عن مجرد أمر واحد، نحو سير عمل قائم على الوكلاء.

بعبارة أخرى، لا يُعرض هذا الإنجاز المزعوم على أنه إجابة نموذج لغوي خالصة في مرة واحدة. بل هو أقرب إلى إطار بحث منسق: عدة مثيلات من النموذج، وتفكيك للمشكلة، وتلخيص، ومقارنة تكرارية للنهج. وهذا يجعل النتيجة أقل شبهاً بعرض تجريبي أنيق وأكثر شبهاً بنظرة مسبقة إلى الكيفية التي قد يجري بها العمل الرياضي بمساعدة الذكاء الاصطناعي عمليًا.

ويقول المصدر أيضًا إن Mythos كثيرًا ما سلك مسارًا مختلفًا عن نموذج OpenAI. وإذا كان ذلك دقيقًا، فهذا يشير إلى شيء أكثر إثارة للاهتمام من مجرد التكرار. فاستراتيجيات الحل المستقلة أقرب إلى القيمة البحثية الحقيقية من مجرد إعادة إنتاج خط تفكير معروف.

لماذا المقارنة مهمة

تذكر المقالة أن عالم الرياضيات Daniel Litt وصف نتيجة Anthropic بأنها “أسوأ قليلًا” من نتيجة OpenAI، لكنه قال أيضًا إن Mythos وجد حل OpenAI. وهذا تذكير مفيد بأن البرهانات ليست كلها متساوية. ففي الرياضيات، تهم الأناقة والاختصار والجِدّة المفاهيمية إلى جانب الصحة.

ومع ذلك، فالخلاصة الاستراتيجية ليست أن برهان مختبر كان أجمل من الآخر. بل إن عدة مختبرات تبدو الآن مقتنعة بأن أنظمتها قادرة على التعامل مع المشكلات الرياضية المفتوحة بمستوى أعلى بكثير من الأجيال السابقة. وعندما يصبح ذلك قابلاً للتكرار، ينتقل السؤال من: “هل يستطيع الذكاء الاصطناعي فعل ذلك أصلًا؟” إلى: “كم مرة، وبأي استقلالية، ومع أي مستوى من الإشراف البشري؟”

كما يذكر The Decoder إعلان Google DeepMind الأخير بأن نظامًا مدعومًا بالذكاء الاصطناعي حل تسع مسائل لإردوش باستخدام Lean، وهي لغة برهان رسمية. وهذه المقارنة توضح فرقًا مهمًا في عمل الذكاء الاصطناعي الرياضي الحالي. فبعض الأنظمة تعتمد بشدة على بيئات التحقق الرسمي؛ بينما يُحكم على أنظمة أخرى أكثر بناءً على الاستدلال باللغة الطبيعية والاستكشاف القائم على الوكلاء. ولم يحسم المجال بعد أي أسلوب يكشف أكثر عن القدرة الخام.

التحول الأكبر

ما يجعل هذه القصة قابلة للاستمرار ليس الحدسية المحددة وحدها، بل سرعة الادعاءات اللاحقة. كانت المشكلات المفتوحة في الرياضيات تُعد علامات واضحة على الحدود بين تفكير الإنسان والآلة. أما هذه الحدود فتبدو الآن أكثر نفاذًا، خاصة عندما تجمع المختبرات بين النماذج المتقدمة وأدوات التنسيق التي تتيح لها التفرع والمقارنة والتلخيص وإعادة المحاولة.

ولا يزال هناك فرق كبير بين نجاح مختبري مُعلن وبين نظام بحثي مستقر وموثوق على نطاق واسع. فالتحقق والمراجعة العلمية وقابلية إعادة الإنتاج تظل أمورًا أساسية. لكن النمط بات من الصعب تجاهله: لم تعد مختبرات الذكاء الاصطناعي تقدم فقط مكاسب في الاختبارات أو مساعدين استهلاكيين مصقولين، بل تقدم أنظمتها بصورة مساهمين في العمل المعرفي المتقدم.

إذا استمرت هذه الادعاءات في الصمود، فلن تعود العناوين الخاصة برياضيات الذكاء الاصطناعي حالات شاذة نادرة، بل ستبدو كفئة بحثية ناشئة بحد ذاتها.

  • يقول موظفون في Anthropic إن Claude Mythos يستطيع حل حدسية إردوش للمسافة الواحدة.
  • الإعداد المزعوم استخدم عدة مثيلات من Claude Code تعمل بشكل منسق، بدلًا من أمر واحد بسيط.
  • القصة الأوسع هي السرعة المتزايدة للعمل المعزز بالذكاء الاصطناعي على مشكلات رياضية مفتوحة منذ زمن طويل.

هذه المقالة مبنية على تغطية The Decoder. اقرأ المقال الأصلي.

Originally published on the-decoder.com