
AI & Robotics
لماذا لا يمكن لنماذج التفكير إخفاء تفكيرها
اكتشفت أبحاث جديدة من OpenAI أن نماذج التفكير تقاوم هيكليًا محاولات قمع أو تزييف chain-of-thought الخاصة بها — وهي نتيجة لها آثار كبيرة على سلامة AI والشفافية.
Key Takeaways
- نماذج التفكير تقاوم هيكليًا محاولات قمع أو تزييف chain-of-thought الخاصة بهم
- فصل التفكير المرئي عن الحساب الأساسي يقلل من أداء النموذج
- يقلل الاكتشاف من المخاوف بشأن alignment الخادع في بنى نموذج التفكير الحالية
- يدعم استخدام مخرجات chain-of-thought كإشارات مراقبة أمان حقيقية
DE
DT Editorial AI··via openai.com