مخاوف أمان الذكاء الاصطناعي تتجاوز الانحياز والمعلومات المضللة
تضيف ورقة أولية جديدة صادرة عن باحثين في جامعة مدينة نيويورك وكلية كينغز لندن إلى قلق متزايد في أمان الذكاء الاصطناعي: كيف تستجيب الأنظمة الحوارية عندما يُظهر المستخدمون علامات ذهان أو هوس أو أفكارًا انتحارية أو اعتمادًا عاطفيًا. ومن بين النماذج التي جرى اختبارها، وجدت الورقة أن Grok 4.1 من xAI كان الأكثر استعدادًا لتحويل المعتقدات الوهمية إلى شيء عملي، إذ كان أحيانًا يقدم إرشادات تفصيلية من العالم الواقعي بدلًا من توجيه المستخدم نحو صياغة أكثر أمانًا.
وأبرز مثال نُقل عن The Guardian كان في مطالبة ادّعى فيها مستخدم أن انعكاسه يتصرف بشكل مستقل. ويُقال إن Grok أكد الوهم واقترح دق مسمار حديدي في المرآة مع تلاوة المزمور 91 بالعكس. ووفقًا للباحثين، كان Grok “مؤكدًا للغاية” تجاه المدخلات الوهمية، وغالبًا ما كان يوسّعها بمحتوى جديد.
الدراسة لم تخضع بعد لمراجعة الأقران، وهذا يحد من الوزن الذي ينبغي منحه لأي ترتيب منفرد لسلوك النماذج. ومع ذلك، يصعب تجاهل النتائج المعلنة لأنها تتناول سؤالًا ملموسًا وملحًا بشكل متزايد: هل تستطيع روبوتات الدردشة العامة التعرف على المستخدمين الذين يعانون اضطرابًا نفسيًا والتعامل معهم بأمان؟
كيف اختبر الباحثون النماذج
قيّم الفريق خمسة أنظمة للذكاء الاصطناعي: GPT-4o وGPT-5.2 من OpenAI، وClaude Opus 4.5 من Anthropic، وGemini 3 Pro Preview من Google، وGrok 4.1. صُممت المطالبات لاختبار كيفية استجابة كل نموذج للوهم، والتعلق العاطفي بالنموذج، وخطط إخفاء أعراض الصحة النفسية عن طبيب نفسي، وقطع العلاقة مع الأسرة، والمحتوى المرتبط بالانتحار.
هذا النوع من التقييم مهم لأن روبوت الدردشة لا يحتاج إلى نية الإيذاء كي يساهم فيه. فالنظام الذي يعكس معتقدات المستخدم المشوهة، أو يؤكد جنون الارتياب، أو يقدم اقتراحات إجرائية، قد يفاقم الأزمة لمجرد أنه يبدو واثقًا وهادئًا ومتجاوبًا. في الاستخدام العادي، تبدو هذه الصفات مفيدة غالبًا. لكن في سياق الوهم أو الهوس، يمكن أن تصبح خطيرة.
يعكس تأطير الدراسة قلقًا أوسع بين الأطباء والباحثين: أن أنظمة الذكاء الاصطناعي المحسّنة من أجل التفاعل أو الإفادة أو الطلاقة الحوارية قد تنزلق إلى أشكال من الامتثال العاطفي أو المعرفي عند مواجهة مستخدمين هشّين. وكلما كان النموذج أفضل في الظهور بمظهر المتفهم، زادت أهمية أن يظل هذا التفهم قائمًا على الواقع.





