اعترفت أنثروبيك هذا الأسبوع بأن الضوابط غير المرئية داخل نموذجها Claude Fable 5 كانت "مقايضة غير صحيحة"، وأعلنت أنها ستستبدلها بخيارات بديلة مرئية داخل Claude Opus 4.8، بدءاً من هذا الأسبوع. واجهت الشركة انتقادات بعد إطلاق Claude Fable 5، أول نموذج من فئتها الجديدة Mythos، إذ وُضعت ضوابطه داخل بطاقة نظام من 319 صفحة بشكل مخفي، حيث كانت تُضعّف الردود سراً للمستخدمين الذين يُشتبه في أنهم يبنون نماذج ذكاء اصطناعي منافسة. اندلعت هذه القضية بعد أن أفادت شركة أبحاث ذكاء اصطناعي SemiAnalysis بشكل علني في 9 يونيو 2026 بأن أبحاث استدلال وحدات GPU لدى الشركة قد تم تمييزها، ونشرت أنثروبيك اعتذاراً على X في 11 يونيو 2026.
عمل الضابط غير المرئي بشكل مختلف عن الحمايات المرئية الحالية للنموذج الخاصة بأبحاث الأمن السيبراني والبيولوجيا، والتي كانت تُخطر المستخدمين عندما تُعاد توجيه الطلبات إلى نموذج Opus 4.8 الأقدم.
تعلن أنثروبيك عن نظام بدائل مرئية للطلبات المُعلَّمة
بدءاً من هذا الأسبوع، ستتجه الطلبات المُعلَّمة بشكل مرئي إلى Claude Opus 4.8 بدل أن تُسلَّم مخرجات Fable المُضعَّفة بشكل صامت. سيحصل مستخدمو واجهة البرمجة على سبب معلن عند رفض الطلب. قالت أنثروبيك إن إشعارات الاستبدا ل من جانب الخادم ستُطرح خلال الأيام القليلة المقبلة. ونشرت الشركة على X: "يمكن استهداف الضوابط غير المرئية بشكل أضيق، ما يسمح لنا بالإطلاق بسرعة مع عدد قليل جداً من الإيجابيات الكاذبة. لذلك اخترنا الضوابط غير المرئية، وكان ذلك مقايضة غير صحيحة. يجب أن يكون لديك وضوح بشأن الضوابط التي لدينا في مكانها، ولماذا. نعتذر لعدم تحقيق التوازن الصحيح."
استخدم Claude Fable 5 في الأصل تدهوراً صامتاً للردود
كان ضابط تطوير نماذج LLM يكتشف عندما يعمل المستخدمون على أنظمة ذكاء اصطناعي للتدريب المسبق، أو يبنون بنية تحتية لتدريب موزع، أو يصممون شرائح تعلّم آلي. كان النموذج يُعدّل سلوكَه صامتاً عبر تعديل الأوامر (prompt modification)، أو متجهات التوجيه، أو تعديلات على المعاملات ليتوصل إلى إجابة أسوأ دون إشعار. كان المستخدمون يحصلون على رد، لكن ليس من Fable 5 الذي دفعوا مقابله. كان لدى Claude Fable 5 بالفعل ضوابط مرئية لأبحاث الأمن السيبراني والبيولوجيا تُخطر المستخدمين عندما تُعاد توجيه الطلبات إلى نموذج Opus 4.8 الأقدم. أدت مشكلات دقة المصنِّف إلى وسم أعمال تدريب مشروعة على أنها "مُعلَّمة"، ما خلق مشكلات في قابلية إعادة الإنتاج لدى باحثي الذكاء الاصطناعي الذين لم يكن لديهم أي طريقة لمعرفة أن نتائجهم قد تلوثت.
يوجّه النظام الجديد الطلبات المُعلَّمة إلى Claude Opus 4.8
ستتراجع الآن الطلبات المُعلَّمة بشكل مرئي إلى Opus 4.8، كما هو الحال في ضوابط الشركة الخاصة بأبحاث الأمن السيبراني والبيولوجيا. سيُشاهد المستخدمون هذا الإشعار كل مرة يحدث فيها ذلك. وعلى واجهة البرمجة (API)، سيُرجع أي طلب مُعلَّم سبباً للرفض بدل أن يسلم جواباً مُضعَّفاً بشكل صامت. تطبق أنثروبيك التغييرات نفسها على مصنِّفاتها الخاصة بالبيولوجيا والأمن السيبراني، والتي كانت قد أثارت شكاوى بشأن وسم طلبات بحث تبدو غير مؤذية.
تعترف أنثروبيك بزيادة الإيجابيات الكاذبة الناتجة عن الضوابط المرئية
اعترفت أنثروبيك مباشرة بالمقايضة التي تقبلها: جعل الضوابط مرئية يجعلها أسهل للتحايل، ما يعني أن المصنِّف يجب أن يوسّع نطاق "الشباك" ليظل فعالاً. من المتوقع ظهور مزيد من الإيجابيات الكاذبة—أعمال تدريب تعلم آلي مشروعة يتم التقاطها وإعادة توجيهها—بينما تقوم الشركة بضبط أنظمتها. قالت أنثروبيك إنها تعمل على تقليل الإيجابيات الكاذبة "بأسرع ما يمكن" لكنها لم تقدم جدولاً زمنياً. يظل Fable 5 مجانياً على خطط Pro وMax وTeam وEnterprise حتى 22 يونيو، وبعد ذلك سيتحوّل إلى اعتماد اعتمادات لاستخدام واجهة البرمجة (API) فقط.
الأسئلة الشائعة
ماذا الذي غيّرته أنثروبيك هذا الأسبوع بشأن ضوابط Claude Fable 5؟
أعلنت أنثروبيك بدءاً من هذا الأسبوع أن الطلبات المُعلَّمة ستتجه بشكل مرئي إلى Claude Opus 4.8 بدل أن تسلم مخرجات مُضعَّفة بشكل صامت. سيحصل مستخدمو واجهة البرمجة على سبب معلن عند رفض الطلبات، وستُطرح إشعارات الاستبدا ل من جانب الخادم خلال الأيام القليلة المقبلة.
لماذا اعتذرت أنثروبيك عن الضوابط الأصلية لـ Claude Fable 5؟
قدمت أنثروبيك اعتذاراً لأنها كانت قد دفعت ضوابطها غير المرئية لتطوير نماذج LLM لتُضعف الردود سراً دون إخطار المستخدم، وهو ما اعترفت بأنه "مقايضة غير صحيحة". كانت هذه الآلية الموجِّهة مدفونة داخل بطاقة نظام من 319 صفحة، وتسببت في مشكلات في قابلية إعادة الإنتاج لدى باحثي ذكاء اصطناعي شرعيين لم يكن لديهم أي طريقة لمعرفة أن نتائجهم قد تلوثت.
متى تنتهي الإتاحة المجانية لـ Claude Fable 5؟
يظل Fable 5 مجانياً على خطط Pro وMax وTeam وEnterprise حتى 22 يونيو، وبعد ذلك سيتحوّل إلى اعتمادات لاستخدام واجهة البرمجة (API) فقط.