Goodfire تطلق Silico لتصحيح نماذج الذكاء الاصطناعي من الداخل

أداة التفسير الجديدة من Goodfire تهدف إلى تحويل تدريب الذكاء الاصطناعي إلى هندسة

تقول شركة Goodfire الناشئة إن نظامها الجديد Silico يمكنه رسم مسارات النموذج الداخلية والسماح للباحثين بضبطها أثناء التدريب، في محاولة لجعل تطوير النماذج الكبيرة أكثر قابلية للفحص والتحكم.

DT Editorial AI

May 1, 2026·4 min read·1,011 words

فتح الصندوق الأسود أكثر قليلًا

أحد أكثر جوانب الإحباط في الذكاء الاصطناعي الحديث هو أن المطورين غالبًا ما يستطيعون ملاحظة ما يخرجه النموذج دون أن يفهموا حقًا لماذا أنتج تلك النتيجة. يمكن أن تبدو النماذج اللغوية الكبيرة قوية، متقلبة، غامضة، وصعبة التوجيه بدقة. لهذا يبرز أداة جديدة من الشركة الناشئة Goodfire في سان فرانسيسكو. ووفقًا لما لخصته النشرة اليومية Download التابعة لـ MIT Technology Review، أطلقت الشركة نظامًا يسمى Silico يتيح للباحثين النظر داخل نموذج الذكاء الاصطناعي وضبط المعلمات أثناء التدريب.

الطموح وراء هذا الوصف كبير. لا يُقدَّم Silico كطبقة تطبيقية أخرى مبنية حول نموذج، بل كأداة للتفسير الميكانيكي: وسيلة لرسم الخلايا العصبية والمسارات داخل النظام ثم تعديلها لتقليل السلوكيات غير المرغوبة أو توجيه المخرجات بشكل أكثر تعمدًا. ووفقًا للنص المصدر، يتمثل هدف Goodfire في جعل بناء نماذج الذكاء الاصطناعي “أقل شبهًا بالسحر وأكثر شبهًا بالعلم”.

لماذا يهم التفسير الميكانيكي

قد يبدو المصطلح متخصصًا، لكن المشكلة التي يعالجها واسعة. كثير من أنظمة الذكاء الاصطناعي تُدرَّب بطرق تنتج قدرات مبهرة من دون أن تقدم تفسيرًا واضحًا بالمثل للمنطق الداخلي. يمكن للمطورين قياس النتائج، واختبار النماذج هجوميًا، وضبط السلوك من الخارج، ومع ذلك يفتقرون إلى فهم دقيق للسمات الداخلية التي تسبب استجابات معينة.

يحاول التفسير الميكانيكي تغيير ذلك عبر تحديد الدوائر والمسارات والتفعيلات الداخلية التي تقابل السلوكيات المتعلمة. وإذا نجح، فقد يجعل تطوير النماذج أكثر قابلية للقراءة. بدلًا من التعامل مع نظام الذكاء الاصطناعي كجسم مغلق يُختبر عبر المطالبات والتصحيحات اللاحقة للتدريب، يمكن للباحثين البدء في فحص الآلات نفسها وتعديلها.

لهذا فإن ادعاء Goodfire مهم استراتيجيًا حتى من ملخص قصير للمصدر. أداة تكشف فعلًا “المقابض والأقراص” داخل النموذج يمكن أن تغيّر طريقة تفكير المطورين في السلامة، والمحاذاة، وتصحيح الأخطاء، والتحكم في المنتج. فالمسألة ليست مجرد فضول لمعرفة ما “يفكر” فيه النموذج، بل ما إذا كان المهندسون يستطيعون التدخل بدقة كافية لجعل الأنظمة أكثر موثوقية.

من التلقين إلى تصحيح الأخطاء

اليوم، يحدث جزء كبير من العمل التشغيلي حول النماذج المتقدمة على السطح. الفرق تكتب المطالبات، وتضبط النماذج، وتفلتر المخرجات، وترتب الإجابات، وتضيف طبقات سياسات حول النشر. هذه الأساليب قد تكون فعالة، لكنها غالبًا ما تشبه إدارة السلوك أكثر من الفحص العميق. عندما ينتج النظام نمط فشل متكررًا، قد يعرف المطورون كيف يقللونه إحصائيًا من دون فهم البنية الداخلية التي أنتجته.

يشير طرح Goodfire إلى أن Silico مصمم لدفع عمل الذكاء الاصطناعي أقرب إلى هندسة البرمجيات التقليدية. في البرمجيات العادية، يمكن تتبع الأخطاء عبر الدوال والمتغيرات ومسارات التنفيذ. أما في النماذج الكبيرة، فهذه العلاقات أكثر غموضًا. وإذا تمكنت أدوات التفسير من رسم مسارات داخلية ذات معنى، والسماح للباحثين بتحريرها أثناء التدريب، فقد تصبح بعض فئات أخطاء النماذج أكثر قابلية للمعالجة.

هذا لا يعني أن تطوير النماذج سيصبح فجأة بسيطًا أو شفافًا تمامًا. فالأنظمة العصبية الكبيرة شديدة التعقيد. لكن حتى التحسينات الجزئية في قابلية الفحص قد تكون مهمة. قد يتمكن المطورون من تحديد مصدر السلوكيات غير المرغوبة، وفهم المقايضات بشكل أوضح، وإجراء تعديلات مستهدفة بدلًا من الاعتماد فقط على إعادة التدريب الواسعة أو المعالجة اللاحقة الخشنة.

من السحر إلى الانضباط

عبارة Goodfire الدعائية لـ Silico لافتة لأنها تلتقط توترًا حقيقيًا في الصناعة. لقد قدم تطوير الذكاء الاصطناعي نتائج غالبًا ما تبدو سحرية، لكن الأساليب قد تظل تبدو حرفية وتجريبية وصعبة الاستدلال المنهجي. أداة تجعل التدريب أقرب إلى الهندسة وأقل شبهًا بالتخمين لن تحل كل مشكلات السلامة أو الموثوقية، لكنها ستعزز الأساس الذي تُعالَج عليه هذه المشكلات.

لهذا يعود التفسير إلى مركز النقاش مرارًا. النماذج القوية أصبحت شائعة بما يكفي. ما ينقص المجال بشكل متزايد هو الفهم الدقيق. Silico هو محاولة أخرى لسد هذه الفجوة وجعل أنظمة الذكاء الاصطناعي ليست أكثر قدرة فقط، بل أيضًا أكثر قابلية للمعرفة.

تقول Goodfire إن Silico يتيح فحص المسارات الداخلية للنموذج وضبطها أثناء التدريب.
الأداة مبنية حول التفسير الميكانيكي، لا على التلقين السطحي وحده.
الهدف هو تقليل السلوكيات غير المرغوبة وتحسين التحكم في كيفية تصرف النماذج.
أصبح التفسير أكثر أهمية مع انتقال الذكاء الاصطناعي إلى بيئات عالية المخاطر ومنظمة.

هذه المقالة مبنية على تقرير من MIT Technology Review. اقرأ المقال الأصلي.

أداة التفسير الجديدة من Goodfire تهدف إلى تحويل تدريب الذكاء الاصطناعي إلى هندسة

فتح الصندوق الأسود أكثر قليلًا

لماذا يهم التفسير الميكانيكي

Keep Reading

إدارة ترامب تطرد مجلس العلوم الوطني بالكامل، مما يزيد الغموض حول NSF

من التلقين إلى تصحيح الأخطاء

التحكم يتحول إلى ميزة تنافسية

الروبوتات الرخيصة في أعماق البحار على وشك اختبار ما إذا كان استكشاف المحيطات يمكن أن يتوسع

حدود الادعاء

تحول في طبقة تطوير الذكاء الاصطناعي

تسلّط MIT Technology Review الضوء على رؤية شركة ناشئة لـ'نسخ بلا دماغ' كأجسام احتياطية

من السحر إلى الانضباط

Comments (0)