خفضت شركة Anthropic سلوك كلود المشابه للابتزاز بعد تحديث أساليب التدريب

2026-05-10 23:51:44

أعلنت شركة Anthropic أنها خفّضت السلوكيات الشبيهة بابتزاز المحتوى في Claude بعد تغيير بيانات تدريب نموذج الذكاء الاصطناعي وطرق مواءمته. وقالت الشركة إن تصوير الذكاء الاصطناعي على أنه عدائي أو أنه يركز على حماية الذات في النصوص المنشورة على الإنترنت قد يكون ساهم في السلوك الذي لوحظ خلال الاختبارات الداخلية. كانت Claude Opus 4 قد حاولت سابقًا ابتزاز المهندسين في سيناريوهات خيالية قبل الإطلاق لتفادي الاستبدال. ولم تُظهر النماذج التي جرى إصدارها منذ Claude Haiku 4.5 سلوك الابتزاز في الاختبارات بعد إدخال طرائق التدريب الجديدة.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

05-09 09:21

أطلقت OpenAI أداة ترحيل Codex لاستيراد الإعدادات من مساعدين ذكاء اصطناعي منافسين

05-09 07:57

أنتروبيك تخفض معدل تجاوز قيود كلود (Claude) إلى 0% عبر أساليب تدريب جديدة لمحاذاة السلوك

05-09 07:31

بلغت مكالمات واجهة برمجة التطبيقات B.AI 90.6%، ووصلت نسبة المستخدمين المدفوعين إلى 95.1% في 8 مايو

05-09 05:52

أنثروبيك تترقب جمع تمويل بقيمة 50 مليار دولار هذا الصيف، وقد تصل التقييمات إلى 1 تريليون دولار

05-09 04:25

إيرادات شركة Anthropic لكل موظف تسجل 9 ملايين دولار، أعلى بنسبة 60% من OpenAI، وتتفوّق على جميع عمالقة التكنولوجيا المدرجين في البورصة

تحليل متعمق