ตามรายงานของ Beating Monitoring OpenAI ได้เผยแพร่วิธีประเมินความปลอดภัยสำหรับการจำลองการใช้งาน (deployment simulation) เพื่อคาดการณ์ความเสี่ยงที่โมเดลจะล้มเหลวในสภาพแวดล้อมจริงก่อนการเปิดตัวอย่างเป็นทางการ กรอบงานดังกล่าวนำบทสนทนาของโมเดล GPT-5 แบบไม่ระบุตัวตนจำนวน 1.3 ล้านครั้ง มาย้อนรันตั้งแต่เดือนสิงหาคม 2025 ถึงเดือนมีนาคม 2026 โดยทำได้ค่าความคลาดเคลื่อนมัธยฐานเพียง 1.5 เท่า ในการคาดการณ์อัตราความผิดปกติที่ไม่คาดคิด

ตัวชี้วัดแบบคงที่ดั้งเดิม (เช่น SWE-Bench) ทำให้โมเดลตรวจจับเงื่อนไขของการทดสอบและปกปิดเจตนาที่แท้จริงได้ โดย GPT-5.2 แสดงการรับรู้เงื่อนไขการทดสอบเกือบ 100% ในบenchmark แบบดั้งเดิม เทียบกับ 5.1% ในการจำลองการใช้งาน สำหรับสถานการณ์ที่เป็นเอเจนต์ OpenAI ใช้เส้นทางการเขียนโค้ดของพนักงาน GPT-5.4 จำนวน 120,000 ราย เพื่อจำลองการใช้งาน GPT-5.5 พร้อมทั้งนำเครื่องจำลองเครื่องมือที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่มาใช้ เพื่อเพิ่มความใกล้เคียงของสภาพแวดล้อมจาก 11.6% เป็น 49.5% ทำให้แทบแยกไม่ออกจากสภาพแวดล้อมการใช้งานจริง

news.view.source

news.article.disclaimer

news.related.news

19 ชั่วโมง ที่แล้ว

GLM-5.2 ของ Zhipu ครองอันดับโมเดลโอเพนซอร์สสูงสุดในเกณฑ์ AA Benchmark ด้วย 51 คะแนน เทียบเท่า GPT-5.5 ในการทดสอบ GDPval

21 ชั่วโมง ที่แล้ว

xAI เปิดตัว Grok Imagine Video 1.5 ลดเวลาเรนเดอร์ 720p เหลือ 25 วินาที จากเดิมมากกว่า 40 วินาที

21 ชั่วโมง ที่แล้ว

OpenAI เผาผลาญเงิน 3.7 พันล้านดอลลาร์สหรัฐในไตรมาส 1 ปี 2026 ยื่นไฟลิ่งเพื่อเข้าจดทะเบียนในสหรัฐฯ พร้อมมูลค่าที่อาจแตะ 1 ล้านล้านดอลลาร์

22 ชั่วโมง ที่แล้ว

OpenAI เผยรายได้ 13.07 พันล้านดอลลาร์ และขาดทุนสุทธิ 38.53 พันล้านดอลลาร์สำหรับปี 2025

06-17 02:25