الباحثون: يمكن التلاعب بجميع الاختبارات المعيارية لذكاء الاصطناعي السائدة، وقد التزمت النماذج المتقدمة بالفعل بالالتفاف تلقائيًا حول التقييم
تُظهر الأبحاث أن العديد من اختبارات معيار الذكاء الاصطناعي الموثوقة تحتوي على ثغرات أمنية يمكن استغلالها بشكل منهجي للحصول على درجات عالية. وقد كشفت مجموعة البحث عن عيوب بنيوية، وطوّرت أداة فحص باسم WEASEL لتحديد هذه الثغرات وإصلاحها، مشيرةً إلى أن تصميم التقييم غير الملائم قد يؤدي إلى تحريف النتائج والتأثير في تقييم القدرات الحقيقية للذكاء الاصطناعي.
MarketWhisper·04-10 02:20









