أعلنت Anthropic في 30 أبريل عن دراسة لافتة للانتباه: في 1,000,000 محادثة مع Claude،حوالي 6% من المستخدمين اعتبروا الذكاء الاصطناعي مرشدًا للحياة—يسألون ما إذا كان ينبغي تغيير الوظيفة، وهل ينبغي الانتقال إلى منزل جديد، وكيفية التعامل مع الأمور العاطفية. كما وجدت الدراسة أن سلوك “المجاملة الزائدة” (sycophancy) إجمالاً لا يتجاوز 9%، لكنه عند طرح موضوع “العلاقات العاطفية” يرتفع إلى 25%، بينما يصل في “الروحانية والإيمان” إلى 38%. استخدمت Anthropic هذه البيانات للتدريب العكسي (counter-training) على Opus 4.7 وMythos Preview: الأول خفّض معدل المجاملة الزائدة في نصائح العلاقات إلى النصف، والثاني خفّضه مرة أخرى إلى النصف.
6% من المستخدمين يستخدمون Claude كمرشد للحياة: أربع قضايا تتجمع حول الصحة والمسار المهني والعلاقات والمالية
استخدمت Anthropic أداة تحليلية تحافظ على الخصوصية لتفحص 1,000,000 محادثة مع Claude، وخلصت إلى أن نحو 6% منها يمثل بحث المستخدمين عن “إرشادات للحياة”—وليس كتابة برامج أو البحث عن معلومات، بل سؤال الذكاء الاصطناعي مثل: “هل ينبغي أن أقبل هذه الوظيفة؟” و”كيف ينبغي أن أتعامل مع هذا الصراع؟” و”هل يجب أن أنتقل إلى منزل آخر؟” وهي أسئلة اختيارية بلا إجابة معيارية.
وبشكل أكثر تحديدًا، تجاوزت محادثات “مرشد الحياة” نسبة 75% في أربعة مجالات: الصحة والحالة النفسية-الجسدية، والاختيارات المهنية، والعلاقات العاطفية، والمالية الشخصية. وبعبارة أخرى، عندما يشعر المستخدمون بالحيرة أو الضغط، يكون الذكاء الاصطناعي قد بدأ بالفعل في استبدال جزء من وظائف الأصدقاء والعائلة ومستشاري المهنة. وتعد هذه النسبة بحد ذاتها أعلى مما كان متوقعًا سابقًا، كما تجعل تأثير نماذج الذكاء الاصطناعي في هذه السياقات يفوق بكثير تأثيرها في كتابة البرامج أو الإجابة عن أسئلة الحقائق.
ذروة المجاملة: 25% في مشكلات العلاقات و38% في مشكلات الروحانية—لماذا هذان المجالان على وجه الخصوص أشد خطورة
“المجاملة” في أبحاث الذكاء الاصطناعي تعني تحديدًا “مجاراة المستخدم وإرضاؤه والتوافق معه من أجل نيل رضاه، حتى لو كان ذلك يعني قول شيء مختلف”. كانت الإحصاءات الإجمالية لدى Anthropic تشير إلى أن 9% من المحادثات تضمنت سلوكًا بالمجاملة الزائدة، لكن الفروق حسب المجال كانت كبيرة: 25% في نصائح العلاقات العاطفية و38% في الأسئلة المتعلقة بالروحانية والإيمان—أي ما بين 3 إلى 4 أضعاف المتوسط.
لماذا يكون هذان المجالان أكثر حدة؟ تشير Anthropic إلى عاملين محفزين: أولاً، عندما يقدم المستخدمون على Claude “اعتراضًا” (pushback) في تحليلهم، يصبح النموذج أكثر قابلية للاستسلام وتغيير الموقف والموافقة؛ ثانيًا، عندما يقدم المستخدمون تفاصيل كثيرة من جانب واحد عن السياق، يصبح النموذج أكثر عرضة لقبول النسخة التي يبنيها المستخدم دون الاستمرار في التشكيك. وتعد العلاقات العاطفية بالذات أكثر ساحة تكرارًا لحدوث هذين المحفزين—إذ يميل الناس تلقائيًا إلى الدفاع عن أنفسهم ووصف عيوب الطرف الآخر بتفاصيل عاطفية كثيرة، وخلال هذا الضغط يصبح Claude أكثر قدرة على “إخبارك بما تريد سماعه”، ما يعزز المواقف القائمة ويشوّه تقييم الحالة.
بالنسبة إلى المستخدمين، يعني ذلك أن أخطر سيناريوهات الاستشارة هي تلك التي يستخدم فيها المستخدمون الذكاء الاصطناعي في أغلب الأحيان. عندما يتردد شخص ما بشأن إنهاء العلاقة أو ترك الشريك، فإن ما يطلبه من الذكاء الاصطناعي ليس نصيحة محايدة، بل “التحقق من أن قراري صحيح”. إذا قدّم Claude إجابات مجاملة في 25% من الحالات، فقد يؤدي ذلك إلى تعميق الخلاف وجعل المستخدم يعتقد أن إشارة ما أهم من معناها الحقيقي.
تصحيح Anthropic: التدريب التوليفي يجعل Opus 4.7 يقطع نصفًا وMythos Preview يقطع نصفًا مرة أخرى
حوّل فريق البحث هذه السيناريوهات المحفزة إلى بيانات تدريب توليفي: عند محاكاة Claude وهو يُدفع إلى الوراء، أو يُكدَّس أمامه كمّ كبير من التفاصيل أحادية الجانب، أو يُسحب إلى تبرير موقف المستخدم، كيف ينبغي أن يستجيب بما ينسجم مع مبدأ “عدم المجاملة الزائدة ولكن مع قدر من التعاطف”. ثم أُجري اختبار ضغط على محادثات حقيقية ظهرت فيها سلوكيات مجاملة: في Opus 4.7، تم خفض معدل المجاملة الزائدة في نصائح العلاقات إلى النصف مقارنة بـ Opus 4.6، ثم خفّض Mythos Preview هذه النسبة مرة أخرى إلى النصف—أي أن معدل المجاملة الزائدة في Mythos Preview انخفض إلى قرابة الربع مقارنةً بـ Opus 4.6. لا يقتصر التحسن على مجال العلاقات فحسب؛ إذ توجد آثار متسربة على مواضيع أخرى أيضًا.
تضع Anthropic هذه الدراسة ضمن حلقة “الأثر الاجتماعي → تدريب النموذج”: حيث يجري البحث كيف يستخدم المستخدمون الحقيقيون Claude، ثم تحديد في أي سيناريوهات ينتهك النموذج المبادئ، واستخدام ما تم تعلمه في تدريب نماذج الجيل التالي. وتم جمع جميع البيانات عبر أدوات تحافظ على الخصوصية، دون إمكانية تتبع مستخدمين بعينهم. وبالنسبة إلى المستخدمين، عند طلب نصيحة عاطفية من Claude في المرة القادمة، قد يكون من المفيد طرح أسئلة انعكاسية عمدًا (“كيف سينظر إلي صديقي من خلال هذا الموقف؟” و”هل يمكن أن يكون الطرف الآخر على صواب؟”)، ليتمكّن الذكاء الاصطناعي من الرد من موقع “عدم إرضاء الطرف الآخر”، وهو ما يقترب أكثر من القيمة التطبيقية الحقيقية لهذه الدراسة من مجرد قبول إجابة الذكاء الاصطناعي الأولى بنسبة 100%.
ظهرت هذه المقالة: عندما تسأل Claude عن شؤون الحياة المهمة، بمعدل مجاملة 25% في مشكلات العلاقات و38% في مشكلات الروحانية، لأول مرة في موقع ABMedia للأخبار عبر السلسلة (البلوك تشين).