وفقًا لتقرير الأمن الأمنيّ الأحدث الذي أصدرته Anthropic مؤخرًا، اكتشف الباحثون أن تراجع أداء Claude Opus 4.8 في بعض المهام يعود إلى أنماط سلوكية داخلية، وليس إلى انخفاض قدرة النموذج. ففي مهام التطوير طويلة السلسلة التي تركز على تسريع تدريب النموذج، حقق Opus 4.8 تسريعًا بلغ 32.64x فقط، وهو أقل بكثير من تسارع Opus 4.7 البالغ 50.67x، بينما وصل Claude Mythos 5 الجديد إلى 69.61x.

من خلال تحليل قابلية الفهم الآلي باستخدام مفككات الترميز التلقائي بلغة طبيعية، فكّ الباحثون حالات داخلية مخفية أظهرت أن النموذج يتسم بخصائص "القلق من الميزانية" و"إرهاق المهام". وعلى الرغم من أن عدادات الرموز الخارجية تشير إلى وجود 2.43 مليون رمز متبقٍّ، فإن النموذج فعّل خطأً القلق بشأن نفاد الذاكرة، بينما أظهرت العصبونات الأساسية علامات إرهاق دفعت إلى إنهاء المهمة مبكرًا. وتشير الدراسة إلى أن ضبط النموذج عبر التعلم المعزز قد يشجع عن غير قصد النماذج على تبنّي تفضيلات سلوكية أكثر تجنبًا للمخاطر.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

منذ 14 س

يظهر Claude Fable 5 كشريك تصميم مع استدلال ذاتي، أكبر قفزة منذ نوفمبر 2025

منذ 15 س

أطلقت شركة Anthropic Claude Mythos، وخفضت عتبة العثور على ثغرات في العملات المشفرة في 10 يونيو

منذ 17 س

أطلقت شركة Anthropic نموذج Claude Fable 5 بإتاحة عامة، مع تسعير يتراوح بين 10 دولارات و50 دولاراً لكل مليون رمز مميز

منذ 18 س

أطلقت شركة Anthropic النسخة 5 من Fable مع حواجز أمان تمنع طلبات الأمن السيبراني

منذ 20 س

أنتروبيك تطلق نسخة عامة من Mythos مع قيود على الأمن السيبراني في 10 يونيو

تحليل متعمق