قابلية التفسير الميكانيكية تنتقل من فكرة بحثية إلى فئة منتجات

أطلقت الشركة الناشئة في سان فرانسيسكو Goodfire أداة تسمى Silico تهدف إلى تمكين مطوري النماذج من فحص نماذج اللغة الكبيرة والتأثير في سلوكها أثناء التدريب. ورسالة الشركة بسيطة لكنها طموحة: بناء أنظمة الذكاء الاصطناعي يجب أن يبدو أقل شبهاً بالسحر وأكثر شبهاً بالهندسة البرمجية.

هذا التصور يلامس أحد أبرز مصادر الإحباط في الذكاء الاصطناعي الحديث. فالنماذج الكبيرة قد تقدم أداءً رائعاً بينما تظل صعبة الفهم على مستوى تفصيلي. يمكن للمطورين مراقبة المخرجات، وضبط السلوك، وقياس النتائج، لكنهم غالباً يفتقرون إلى خريطة واضحة تشرح لماذا يتصرف النموذج داخلياً بالطريقة التي يفعلها. وهذا يجعل تشخيص الأعطال أكثر صعوبة، ويجعل منع السلوكيات غير المرغوب فيها أصعب أيضاً.

وترى Goodfire أن قابلية التفسير الميكانيكية يمكن أن تضيق هذه الفجوة، وأن الوقت مناسب لتحويل أساليب هذا المجال إلى منتج أسهل استخداماً.

ما الذي يفترض أن تفعله Silico

بحسب الشركة، تتيح Silico للباحثين والمهندسين النظر داخل النموذج وتعديل المعلمات التي تشكل السلوك بينما لا يزال التدريب جارياً. وتصفها Goodfire بأنها أول نظام جاهز من نوعه صُمم لمساعدة المطورين على تصحيح الأخطاء في مراحل متعددة من إنشاء النموذج، من بناء مجموعة البيانات إلى تدريب النموذج.

والتركيز على التدريب مهم. فقد ركزت كثير من جهود قابلية التفسير على مراجعة النماذج بعد بنائها بالفعل. وهدف Goodfire هو نقل هذه الرؤى إلى مرحلة أبكر من التطوير، بحيث يستطيع صناع النماذج استخدامها كآليات توجيه لا كأدوات تشخيص بعد وقوع المشكلة فقط.

إذا نجح ذلك كما هو معلن، فسيكون التحول ذا مغزى. إذ سيشير إلى مستقبل يستطيع فيه المطورون التدخل بدقة أكبر، بدلاً من الاعتماد أساساً على الحجم، والتجريب بالقوة الغاشمة، ووسائل الحماية اللاحقة.