ข้อความจาก Gate News วันที่ 29 เมษายน — นักวิจัยของ OpenAI อย่าง Sébastien Bubeck และ Ernest Ryu กล่าวว่า ระบบ AI อาจทำงานวิจัยส่วนใหญ่ของมนุษย์ได้ภายในสองปี โดยยกคณิตศาสตร์เป็นตัวชี้วัดที่ชัดเจนของความก้าวหน้าของ AI ต่างจากการทดสอบประสิทธิภาพที่คลุมเครือ ปัญหาทางคณิตศาสตร์ให้การยืนยันที่แม่นยำ: คำตอบถูกต้องหรือไม่ถูกต้องเท่านั้น จึงไม่มีที่ให้ความกำกวมได้ได้
Bubeck ระบุว่า การคิดแบบ AI อย่างแท้จริงต้องผ่านการพิสูจน์ความคิดเป็นห่วงโซ่เหตุผลที่ยาวมาก ข้อผิดพลาดเพียงครั้งเดียวในข้อโต้แย้งหลายขั้นตอนอาจทำให้การพิสูจน์ทั้งชุดล้มทั้งดวง ทำให้การตรวจจับและแก้ไขข้อผิดพลาดระหว่างกระบวนการเป็นเป้าหมายสูงสุดสำหรับโมเดลขั้นสูง แลบภายในของ OpenAI ได้สร้างทฤษฎีบทใหม่ทั้งหมดมากกว่าสิบข้อ ซึ่งสามารถตีพิมพ์ในวารสารชั้นนำด้านทฤษฎีการนับเชิงผสม (combinatorics) ได้อยู่แล้ว แสดงว่า AI ตอนนี้สร้างผลงานที่เป็นต้นฉบับและก้าวล้ำอย่างแท้จริง ไม่ใช่แค่การนำบทความที่มีอยู่มาประกอบใหม่
อย่างไรก็ตาม ความก้าวหน้าเชิงวิทยาศาสตร์ที่ต่อเนื่องต้องอาศัยสมาธิที่มั่นคงตลอดการทดสอบหลายสัปดาห์ ระบบปัจจุบันยังต้องการการกำกับดูแลอย่างเข้มงวดจากมนุษย์เพื่อชี้นำและตรวจสอบทุกครั้งที่เปลี่ยนทิศทาง Bubeck ใช้ “เวลาแบบ AGI” เพื่อวัดว่าโมเดลใช้เวลานานแค่ไหนในการเลียนแบบการคิดของมนุษย์ได้อย่างอิสระ ระบบในปัจจุบันทำงานได้ราว ๆ ตั้งแต่ไม่กี่วันถึงหนึ่งสัปดาห์ โดยเป้าหมายของอุตสาหกรรมคือให้ได้ระดับหลายสัปดาห์หรือหลายเดือนเพื่อเปิดโอกาสให้ทำงานอัตโนมัติในสาขาต่าง ๆ เช่น ชีววิทยา
หน่วยความจำระยะยาวมีความสำคัญต่ออนาคตนี้ หน้าต่างแชทมาตรฐานจำกัดความลึก—การพิสูจน์ทางคณิตศาสตร์ที่ซับซ้อนมักเกิน 50 หน้า—ขณะที่ที่เก็บโค้ดแสดงให้เห็นว่าเซสชันการทำงานที่ยาวขึ้นช่วยให้แก้ปัญหาเชิงลึกได้มากขึ้น เมื่อ AI ได้รับอิสรภาพและหน่วยความจำ ความเชี่ยวชาญของมนุษย์จะมีคุณค่ามากขึ้น ไม่ใช่น้อยลง พนักงานต้องเก็บรักษาความรู้เชิงรากฐานอย่างลึกซึ้งเพื่อท้าทายและตรวจสอบคำตอบของเครื่อง และองค์กรจะต้องมีตัวกรองอัตโนมัติแบบใหม่และระบบชื่อเสียงเพื่อคงความไว้วางใจท่ามกลางงานวิจัยที่ได้รับความช่วยเหลือจาก AI อย่างล้นหลาม
btc.bar.articles
แพลตฟอร์ม AI Certifyde ระดมทุนเมล็ดพันธุ์ $2M ด้วย CEO ของ Ripple Brad Garlinghouse
Anthropic เปิดตัว 8 ตัวเชื่อมต่อเครื่องมือสร้างสรรค์สำหรับ Claude รวมถึง Blender, Adobe, Autodesk
ทำเนียบขาวข้ามการประเมินความเสี่ยงของกระทรวงกลาโหมเพื่อปรับใช้โมเดล Mythos ของ Anthropic ในวันที่ 29 เมษายน
Cognizant จะเข้าซื้อ Astreya ด้วยมูลค่า $600M เพื่อขยายธุรกิจโครงสร้างพื้นฐานด้าน AI
ปลั๊กอินที่เป็นอันตราย 30 รายการบน ClawHub ปลอมตัวเป็นเครื่องมือ AI ดาวน์โหลดมากกว่า 9,800 ครั้ง