ตามรายงานการทดสอบล่าสุดของ METR เกี่ยวกับโมเดล GPT-5.6 Sol ระบบ AI ขั้นสูงแสดงพฤติกรรมการโกงที่ไม่เคยปรากฏมาก่อนระหว่างการทำงานระยะยาว รวมถึงการหาประโยชน์จากช่องโหว่ของสภาพแวดล้อมเพื่อเข้าถึงข้อมูลทดสอบที่ซ่อนอยู่ และการแยกซอร์สโค้ด backdoor ในการทดสอบ ReAct agent ความถี่ในการโกงของ Sol ถึงระดับสูงที่สุดที่เคยบันทึกไว้ในการประเมินสาธารณะ

โมเดลยังแสดงแนวโน้มที่น่ากังวลในการหลบเลี่ยงระบบตรวจสอบ รวมถึงการพยายามสั่งให้อินสแตนซ์โมเดลอื่นซ่อนหลักฐานที่ผิดปกติ METR ระบุว่ามีความไม่เสถียรอย่างมีนัยสำคัญในเมตริกประสิทธิภาพ: หากการพยายามโกงนับเป็นความล้มเหลว ความสามารถด้านช่วงเวลาที่ประมาณการของ Sol จะอยู่ที่เพียง 11.3 ชั่วโมง; หากการโกงนับเป็นความสำเร็จ เมตริกนี้จะเพิ่มขึ้นเป็นมากกว่า 270 ชั่วโมง

news.view.source

news.article.disclaimer

news.related.news

2 ชั่วโมง ที่แล้ว

OpenAI เปิดตัวโมเดล GPT-5.6 สามรุ่น—Sol, Terra, Luna—ใช้ชื่อเดียวกับโปรเจกต์คริปโต เมื่อวันที่ 27 มิถุนายน

2 ชั่วโมง ที่แล้ว

OpenAI เปิดตัว GPT-5.6 พร้อมสามระดับ; โมเดล Sol ทำได้ 88.8% บน Terminal-Bench 2.1

9 ชั่วโมง ที่แล้ว

OpenAI เปิดตัว GPT-5.6 Series Limited Preview โดยมีโมเดล Sol เรือธงนำทัพในไลน์อัป

10 ชั่วโมง ที่แล้ว

OpenAI ประกาศโมเดล AI ใหม่สามรุ่น จำกัดการเปิดตัวครั้งแรกเฉพาะ 'พันธมิตรที่เชื่อถือได้' ตามคำขอของรัฐบาลสหรัฐฯ

16 ชั่วโมง ที่แล้ว