Google Research เปิดตัว ReasoningBank: เอเจนต์ AI เรียนรู้กลยุทธ์การให้เหตุผลจากความสำเร็จและความล้มเหลว

ข่าว Gate News วันที่ 22 เมษายน — Google Research เปิดตัว ReasoningBank ซึ่งเป็นกรอบงานหน่วยความจำของเอเจนต์ที่ช่วยให้เอเจนต์ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่สามารถเรียนรู้อย่างต่อเนื่องหลังการใช้งานจริง กรอบงานจะสกัดกลยุทธ์การให้เหตุผลทั่วไปจากทั้งประสบการณ์ที่ทำสำเร็จและที่ทำไม่สำเร็จ โดยเก็บไว้ในแหล่งหน่วยความจำเพื่อใช้ค้นคืนและดำเนินการในงานในอนาคตที่คล้ายกัน กระดาษที่เกี่ยวข้องถูกเผยแพร่ที่ ICLR และโค้ดถูกเปิดซอร์สบน GitHub.

ReasoningBank พัฒนาต่อยอดจากแนวทางที่มีอยู่ 2 แบบ ได้แก่ Synapse ซึ่งบันทึกเส้นทางการกระทำแบบครบถ้วนแต่มีความสามารถในการถ่ายโอนจำกัดเนื่องจากความละเอียดที่ละเอียดเกินไป และ Agent Workflow Memory ซึ่งเรียนรู้จากกรณีที่ทำสำเร็จเท่านั้น ReasoningBank ทำการเปลี่ยนแปลงสำคัญ 2 ประการ: การเก็บ “รูปแบบการให้เหตุผล” แทนที่จะเป็น “ลำดับการกระทำ” โดยหน่วยความจำแต่ละรายการมีฟิลด์เชิงโครงสร้างสำหรับชื่อ คำอธิบาย และเนื้อหา; และการนำเส้นทางที่ล้มเหลวมาใช้ในการเรียนรู้ กรอบงานใช้โมเดลเพื่อประเมินเส้นทางการปฏิบัติอย่างละเอียดด้วยตัวเอง แปลงประสบการณ์ความล้มเหลวให้กลายเป็นกฎเพื่อหลีกเลี่ยงกับดัก ตัวอย่างเช่น กฎ “คลิกปุ่ม Load More เมื่อเห็น” จะพัฒนาไปเป็น “ตรวจสอบตัวระบุหน้าปัจจุบันก่อน หลีกเลี่ยงลูปการเลื่อนอย่างไม่สิ้นสุด แล้วค่อยคลิก load more”

บทความยังนำเสนอ Memory-aware Test-time Scaling (MaTTS) ซึ่งจัดสรรกำลังประมวลผลเพิ่มเติมระหว่างการอนุมานเพื่อสำรวจเส้นทางหลายแบบ และจัดเก็บข้อค้นพบไว้ในแหล่งหน่วยความจำ การขยายแบบขนานรันเส้นทางที่แตกต่างกันหลายชุดสำหรับงานเดียวกัน โดยปรับปรุงกลยุทธ์ที่ทนทานยิ่งขึ้นผ่านการเปรียบเทียบด้วยตนเอง ส่วนการขยายแบบต่อเนื่องจะปรับปรุงเส้นทางเดียวแบบวนซ้ำ โดยเก็บเหตุผลระดับกลางไว้ในหน่วยความจำ.

ในงานท่องเว็บของ WebArena และงานโค้ดดิ้ง SWE-Bench-Verified โดยใช้ Gemini 2.5 Flash เป็นเอเจนต์แบบ ReAct ReasoningBank ทำอัตราความสำเร็จได้สูงขึ้น 8.3% บน WebArena และสูงขึ้น 4.6% บน SWE-Bench-Verified เมื่อเทียบกับฐานที่ไม่มีหน่วยความจำ ลดจำนวนขั้นเฉลี่ยต่อภารกิจลงประมาณ 3 เมื่อเพิ่ม MaTTS ด้วยการขยายแบบขนาน (k=5) ยิ่งทำให้อัตราความสำเร็จบน WebArena ดีขึ้นอีก 3 จุดเปอร์เซ็นต์ และลดขั้นเพิ่มเติมได้อีก 0.4.

news.article.disclaimer

btc.bar.articles

PicWe เปิดตัวกระเป๋าเงิน AI Agent พร้อมการจัดการคีย์บนอุปกรณ์

PicWe ประกาศเปิดตัวเบตาสาธารณะของ PicWe Wallet กระเป๋าเงินคีย์แบบออนดีไวซ์ที่ขับเคลื่อนด้วยเอเจนต์ AI พร้อมไม่มีวลีสำหรับกู้คืน รองรับสินทรัพย์หลายเชน สวอป การทำงานอัตโนมัติที่เข้าถึงด้วย AI และมุ่งหมายที่จะรวมโครงสร้างพื้นฐานด้าน RWA เข้าด้วยกัน PicWe ได้เปิดตัวเบตาสาธารณะของ PicWe Wallet ซึ่งเป็นกระเป๋าเงินที่รองรับ AI Agent เก็บคีย์ไว้บนอุปกรณ์โดยตรง ตัดความจำเป็นของวลีสำหรับกู้คืน และทำให้การทำงานที่สำคัญยังคงอยู่ในเครื่อง กระบวนการเบตานี้รองรับการจัดการสินทรัพย์หลายเชน การสวอป และค่าธรรมเนียมที่ใช้เหรียญสเตเบิลโคอิน พร้อมทั้งเปิดใช้งานการโต้ตอบกับ AI แบบตั้งโปรแกรมได้ ความคิดริเริ่มที่กว้างขึ้นของ PicWe วางตำแหน่งแพลตฟอร์มให้เป็นโครงสร้างพื้นฐานแบบรวมสำหรับสินทรัพย์ในโลกจริง โดยรองรับการออกโทเค็น การหมุนเวียน การชำระบัญชี การชำระเงินข้ามพรมแดน การทำโทเคไนเซชัน และการประสานงานในห่วงโซ่อุปทานสำหรับกรณีการใช้งานระดับองค์กร

GateNews41 นาที ที่แล้ว

Hugging Face ปล่อยโค้ดโอเพนซอร์ส ml-intern ซึ่งเป็นตัวแทน AI สำหรับการวิจัย ML แบบอิสระ

ปล่อยโค้ดโอเพนซอร์ส ml-intern ตัวแทนวิจัย ML แบบอิสระของ Hugging Face ที่อ่านเอกสาร คัดสรรข้อมูล ฝึก ประเมิน และปรับปรุงอย่างต่อเนื่องข้ามสาขาวิทยาศาสตร์ แพทยศาสตร์ และคณิตศาสตร์. บทคัดย่อ: ml-intern ของ Hugging Face เป็นตัวแทนวิจัย ML แบบอิสระโอเพนซอร์สที่อ่านเอกสาร คัดสรรชุดข้อมูล ฝึกบน GPU ในเครื่องหรือบนคลาวด์ ประเมินผลลัพธ์ และวนลูปเพื่อปรับปรุง Built บน smolagents พร้อมทั้งอินเทอร์เฟซแบบ CLI และแบบเว็บ มันนำทางผ่าน arXiv/HF Papers, HF Hub และ HF Jobs การเดโมครอบคลุมตั้งแต่วิทยาศาสตร์ แพทยศาสตร์ ไปจนถึงคณิตศาสตร์ แสดงให้เห็นระบบอัตโนมัติแบบ end-to-end และการเพิ่มสมรรถนะ.

GateNews46 นาที ที่แล้ว

อาจารย์จาก Tsinghua ไต้ จี้เฟิง เปิดตัว Naive.ai และระดมทุน ~$300M ที่มูลค่า $800M

ข่าวประตูเมือง วันที่ 22 เมษายน — ไต้ จี้เฟิง อาจารย์ประจำคณะวิศวกรรมอิเล็กทรอนิกส์แห่งมหาวิทยาลัย Tsinghua ได้ก่อตั้ง Naive.ai ซึ่งเป็นบริษัทที่มุ่งเน้นการฝึกหลังโมเดลแบบโอเพนซอร์สและเอเจนต์ด้าน AI สตาร์ทอัพดังกล่าวระดมทุนได้ราว $300 ล้านดอลลาร์ โดยประเมินมูลค่าอยู่ที่ประมาณ $80

GateNews2 ชั่วโมง ที่แล้ว

AWS ขยายเวิร์กโฟลว์ AI แบบหลายเอเจนต์ รองรับ Claude Opus 4.7 บน Bedrock

ข่าว Gate News วันที่ 22 เมษายน — Amazon Web Services ประกาศขยายความริเริ่ม AI เชิงเอเจนต์ผ่านเวิร์กโฟลว์แบบหลายเอเจนต์ โดยรองรับ Anthropic's Claude Opus 4.7 บน Amazon Bedrock เพื่อช่วยให้ลูกค้าก้าวพ้นจากการทดลองนำร่องด้าน generative AI บริษัทกำลังขยายความสัมพันธ์กับพาร์ทเนอร์ ขณะที่ลูกค้าปรับเปลี่ยนจากเครื่องมือ AI เดี่ยวไปสู่ระบบที่เชื่อมต่อเอเจนต์เฉพาะทางหลายตัว ซึ่งลูกค้า

GateNews2 ชั่วโมง ที่แล้ว

0G Labs จับมือ Alibaba Cloud เพื่อเปิดการเข้าถึงเอเจนต์ AI แบบบนเชนสู่โมเดล Qwen

ข้อความ Gate News ประจำวันที่ 22 เมษายน — 0G Labs ได้ประกาศความร่วมมือกับ Alibaba Cloud เพื่อให้เอเจนต์ AI สามารถเรียกใช้โมเดลภาษาขนาดใหญ่ Qwen ของ Alibaba ได้โดยตรงบนเชนผ่านโครงสร้างพื้นฐานบล็อกเชนของ 0G ความร่วมมือนี้ถือเป็นการเปลี่ยนแปลงกระบวนทัศน์การเข้าถึง AI จากแนวทางที่อาศัย API สู่

GateNews3 ชั่วโมง ที่แล้ว

0G ผสานรวม Alibaba Cloud Qianwen LLM เข้ากับ AI agent บนเชนเป็นรายแรกที่ได้รับสิทธิ์เข้าถึงโมเดลขนาดใหญ่เชิงพาณิชย์

0G มูลนิธิได้ประกาศเมื่อวันที่ 21 เมษายนว่าจะร่วมมืออย่างเป็นทางการกับ Alibaba Cloud เพื่อนำโมเดลภาษาขนาดใหญ่ Qianwen (Qwen) เข้าสู่โครงสร้างพื้นฐานแบบกระจายอำนาจ ทำให้เอเจนต์ AI สามารถเรียกใช้ LLM ระดับเชิงพาณิชย์ได้โดยตรงจากสภาพแวดล้อมบนเชน นักพัฒนาจะเข้าถึงฟังก์ชันการอนุมานของ Qianwen ผ่านกลไกการควบคุมการเข้าถึงด้วยด่านโทเคน ซึ่งช่วยแปลงการเรียกใช้งาน LLM ให้เป็นการดำเนินการที่วัดได้บนเชนอย่างมีประสิทธิภาพ ทำให้ Qianwen เป็นหนึ่งใน LLM เชิงพาณิชย์หลักกลุ่มแรกที่ถูกฝังไว้ในเฟรมเวิร์กเอเจนต์แบบกระจายอำนาจ

MarketWhisper4 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น