فابل 5 يفشل في جميع أصعب المهام في امتحان ALE بجامعة كاليفورنيا بيركلي، بتكلفة أعلى 4-12 مرات من منافسيه

2026-06-12 11:01:40

وفقاً لـUC Berkeley RDI، تُظهر نتائج تقييم «آخر امتحان للوكالات» (ALE) الأحدث التي تم إصدارها هذا الأسبوع نسبة نجاح بلغت 0% في أصعب المهام التي تتطلب تفكيراً مستمراً وخبرة عميقة عبر جميع وكلاء الذكاء الاصطناعي الذين تم اختبارهم، بما في ذلك Fable 5 المستجد. وفي تكاليف واجهة برمجة التطبيقات لكل مهمة، تقاضى Fable 5 مبلغ 15.70 دولاراً—بمعدل 4 مرات أعلى من GPT-5.5 عند 3.80 دولاراً و12 مرة أعلى من Composer 2.5 عند 1.33 دولار. شمل التقييم 55 مجالاً مهنياً مع أكثر من 1,500 مهمة موثقة من الخبراء، ووجد أن الوكلاء يفشلون في أغلب الأحيان عبر الإعلان عن النجاح مبكراً دون التحقق من النتائج.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

منذ 2 س

تعرّف نموذج Claude Fable 5 التابع لشركة Anthropic على 24,000 حساب احتيالي مرتبطًا بشركات ذكاء اصطناعي صينية

منذ 2 س

اختُرِق Claude Fable 5 في غضون 48 ساعة من إصداره؛ تسربت رسالة النظام على GitHub

منذ 5 س

تكلفة نموذج Fable 5 من Anthropic تتجاوز 50 ضعفاً لكل رمز (token) مقارنةً بـ DeepSeek V4 Pro

منذ 10 س

يتوقع مورغان ستانلي دورة فائقة لرقائق الذاكرة تمتد جيداً بعد نهاية 2026، مدفوعة بطلب الذكاء الاصطناعي

منذ 17 س

تعترف أنثروبيك بالاعتذار عن الأسماء المستعارة السرّية الخمسة في Claude Fable 5، وتستبدلها بخطوط حماية بديلة مرئية لـ Opus 4.8 هذا الأسبوع

تحليل متعمق

ينتج مؤثرو الذكاء الاصطناعي على الإنترنت نسخة مقلدة عبر عبارات الإرشاد من Lovable، وتثير Claude Fable 5 نقاشًا حول السعي لتحقيق الذكاء الاصطناعي العام.

Market Whisperمنذ 10 س

يواجه شركة Anthropic رد فعل عنيفاً بسبب تكاليف رموز Claude Fable 5 وتدهورٍ صامت

Oliver Grant06-10 19:22

تعليق

0/400

لا توجد تعليقات