ปิดข่าว Gate ประจำวันที่ 23 เมษายน — ทีมวิจัยของ Perplexity เผยแพร่บทความทางเทคนิคที่อธิบายระเบียบวิธีหลังการฝึกอบรมสำหรับตัวแทนค้นหาเว็บ แนวทางดังกล่าวใช้โมเดลเปิดซอร์ส Qwen3.5 จำนวน 2 ตัว (Qwen3.5-122B-A10B และ Qwen3.5-397B-A17B) และใช้ไปป์ไลน์แบบ 2 ขั้นตอน ได้แก่ การฝึกแบบมีผู้สอน (SFT) เพื่อสร้างความสามารถในการทำตามคำสั่งและความสอดคล้องด้านภาษา จากนั้นตามด้วยการเรียนรู้แบบเสริมแรงออนไลน์ (RL) เพื่อเพิ่มประสิทธิภาพด้านความถูกต้องของการค้นหาและประสิทธิภาพการใช้เครื่องมือ
ขั้น RL ใช้ทั้งอัลกอริทึม GRPO และแหล่งข้อมูล 2 แหล่ง: ชุดข้อมูลคำถาม-คำตอบแบบหลายขั้นตอนที่ตรวจสอบได้ซึ่งเป็นกรรมสิทธิ์ โดยสร้างจากคำถามเริ่มต้นภายในที่ต้องใช้การให้เหตุผล 2–4 ช่วง และมีการยืนยันด้วยตัวแก้หลายตัว และข้อมูลการสนทนาทั่วไปที่อิงตามเกณฑ์การให้คะแนน ซึ่งจะแปลงข้อกำหนดการนำไปใช้งานให้เป็นเงื่อนไขย่อยที่ตรวจสอบได้อย่างเป็นรูปธรรม เพื่อป้องกันการเสื่อมพฤติกรรมจาก SFT
การออกแบบรางวัลใช้การรวมแบบมีประตูควบคุม—คะแนนความพึงพอใจจะมีส่วนร่วมก็ต่อเมื่อได้ความถูกต้องตามเกณฑ์พื้นฐาน (การจับคู่คำถาม-คำตอบ หรือบรรลุเกณฑ์ทั้งหมดตามรูบริก) เพื่อป้องกันสัญญาณความพึงพอใจที่สูงไม่ให้บดบังความผิดพลาดด้านข้อเท็จจริง การลงโทษด้านประสิทธิภาพใช้การยึดตามกลุ่มภายใน โดยใช้การลงโทษแบบเรียบต่อการเรียกใช้เครื่องมือและความยาวการสร้างที่เกินกว่าค่าพื้นฐานของคำตอบที่ถูกต้องในกลุ่มเดียวกัน
การประเมินแสดงว่า Qwen3.5-397B-SFT-RL ให้ประสิทธิภาพระดับดีที่สุดในกลุ่มเมื่อเทียบกันในชุดการทดสอบการค้นหา ใน FRAMES ทำได้ 57.3% ของความถูกต้องเมื่อเรียกเครื่องมือเพียงครั้งเดียว ซึ่งเหนือกว่า GPT-5.4 ด้วยส่วนต่าง 5.7 จุดเปอร์เซ็นต์ และเหนือกว่า Claude Sonnet 4.6 ด้วยส่วนต่าง 4.7 จุดเปอร์เซ็นต์ ภายใต้งบประมาณปานกลาง (การเรียกเครื่องมือสี่ครั้ง) จะได้ความถูกต้อง 73.9% ที่ $0.02 ต่อคำถาม เทียบกับ GPT-5.4 ที่ได้ 67.8% ที่ $0.085 ต่อคำถาม และ Sonnet 4.6 ที่ได้ 62.4% ที่ $0.153 ต่อคำถาม ตัวเลขต้นทุนอ้างอิงจากราคาต่อสาธารณะของแต่ละผู้ให้บริการ และไม่รวมการปรับปรุงด้านการแคช
btc.bar.articles
ประธานเจ้าหน้าที่บริหารของ Google: รายจ่ายลงทุนปี 2026 จะสูงถึง 1850 ล้านดอลลาร์ เพิ่มการลงทุนในยุคของเอเจนต์อัจฉริยะด้าน AI
ผู้บริหารสูงสุดของ Google นาย Sundar Pichai ประกาศในงาน Google Cloud Next เมื่อวันที่ 22 เมษายน ที่ลาสเวกัสว่า Google วางแผนจะลงทุนระหว่าง 175,000 ล้านถึง 185,000 ล้านดอลลาร์สหรัฐในปี 2026 สำหรับงบลงทุนด้านโครงสร้างพื้นฐานที่จำเป็นต่อการสร้างตัวแทนปัญญาประดิษฐ์แบบอิสระ (AI Agent) เพิ่มขึ้นจาก 31,000 ล้านดอลลาร์สหรัฐในปี 2022
MarketWhisper21 นาที ที่แล้ว
Google Jules เปิดรายชื่อผู้สมัครเวอร์ชันใหม่ที่เปิดตัวอีกครั้ง และปรับตำแหน่งใหม่ให้เป็นแพลตฟอร์มสำหรับการพัฒนาผลิตภัณฑ์แบบครบวงจรจากต้นทางถึงปลายทาง
ตามประกาศอย่างเป็นทางการของทีม Google Jules เมื่อวันที่ 23 เมษายน การวางตำแหน่งผลิตภัณฑ์ของ Jules ได้อัปเกรดจากเอเจนต์โค้ดแบบอะซิงโครนัสเป็น “แพลตฟอร์มพัฒนาแบบเอเจนต์เชิงรุกแบบครบวงจร (end-to-end agentic product development platform)” โดยเวอร์ชันใหม่นี้สามารถอ่านบริบทผลิตภัณฑ์ทั้งหมดได้ ตัดสินใจเองว่าควรสร้างขั้นถัดไปไปในทิศทางใด และส่ง PR ทางการได้ประกาศพร้อมกันด้วยว่าได้เปิดรายชื่อผู้สมัครสำหรับเวอร์ชันใหม่แล้ว
MarketWhisper27 นาที ที่แล้ว
Google Jules รีแบรนด์เป็นแพลตฟอร์มพัฒนาผลิตภัณฑ์แบบเอเจนต์เชิงปฏิบัติการแบบครบวงจร เปิดรายชื่อรอสำหรับเวอร์ชันใหม่
ข้อความข่าวประตู 23 เมษายน — ทีม Jules ของ Google ประกาศเปิดรายชื่อรอสำหรับผลิตภัณฑ์เวอร์ชันใหม่ โดยปรับบทบาทของ Jules จากเอเจนต์สำหรับการเขียนโค้ดแบบอะซิงโครนัสเป็นแพลตฟอร์มพัฒนาผลิตภัณฑ์แบบเอเจนต์เชิงปฏิบัติการแบบครบวงจร ตามคำอธิบายอย่างเป็นทางการ แพลตฟอร์มที่อัปเกรดจะอ่านบริบทของทั้งผลิตภัณฑ์ได้
GateNews1 ชั่วโมง ที่แล้ว
OpenAI Codex 团队修复 OpenClaw 身份验证错误,显著改善代理行为
OpenClaw 从 Pi 切换到 Codex harness,以修复静默身份验证回退问题,并通过两 个 PR 解决桥接与回退;修复后,代理从浅层心跳轮询转为完整的工作循环,从而实现进展。
摘要:OpenClaw 的 Codex harness 优化解决了一个关键身份验证缺陷:当使用带有 OpenAI 模型的 Codex 时,会导致静默回退到 Pi harness。两个拉取请求修复身份验证桥接并防止静默回退,从而更改运行时适配器。结果是,代理行为从浅层心跳轮询演进为读取上下文、分析任务、编辑代码库并验证进展的完整工作循环,从而提升跨心跳的连续性与可见性。
GateNews2 ชั่วโมง ที่แล้ว
เปิด OpenAI สำหรับ ChatGPT Workspace Agents: ขับเคลื่อนด้วย Codex, แชร์ร่วมกันในทีม, บูรณาการกับ Slack
OpenAI เปิดตัว Workspace Agents ใน ChatGPT Business/Enterprise/Edu/Teachers เมื่อวันที่ 22 เมษายน โดยใช้ Codex ขับเคลื่อน ทำงานแบบคลาวด์ได้นานขึ้น แชร์ร่วมกันภายในทีม และสามารถทำงานแบบออฟไลน์ได้ สามารถตอบกลับอัตโนมัติบน Slack และจัดทำการออกใบแจ้งหนี้ รวมถึงดำเนินงานหลายขั้นตอนในเวิร์กโฟลว์ และรองรับการตั้งเวลา การทดลองใช้ฟรีสำหรับการดูตัวอย่างการวิจัยมีให้จนถึงวันที่ 6 พฤษภาคม หลังจากนั้นจะเรียกเก็บค่าบริการแบบ credit-based โดยราคาจะประกาศในภายหลัง แข่งขันร่วมกับ GoogleGeminiEnterpriseAgentPlatform และ AnthropicClaudeCowork ทั้งสามเจ้าโฟกัสที่ตัวแทนระดับองค์กร แต่การวางตำแหน่งแตกต่างกันไป
ChainNewsAbmedia3 ชั่วโมง ที่แล้ว
Google Cloud Next 2026: เปิดตัวแพลตฟอร์มตัวแทนสำหรับองค์กรของ Gemini ด้วยเงิน 750 ล้านดอลลาร์สหรัฐ เพื่อช่วยให้ที่ปรึกษานำไปใช้งานได้จริง
Google Cloud ประกาศแพลตฟอร์ม Gemini Enterprise Agent Platform ในงาน Cloud Next 2026 โดยผสานตัวเลือกโมเดล การสร้างเอเจนต์ DevOps การออร์เคสเตรชัน และการควบคุมความปลอดภัยระดับองค์กร และเปิดตัวกองทุนมูลค่า 750 ล้านดอลลาร์สหรัฐเพื่อช่วย McKinsey, Accenture, Deloitte ในการปรับใช้เอเจนต์ระดับองค์กร แพลตฟอร์มนี้มาพร้อม Ironwood TPU, A2A และ MCP สร้างโซลูชันแบบฟูลสแตกของตนเองและช่องทางสำหรับที่ปรึกษา เพื่อรับมือกับ OpenAI Operator และ Anthropic Claude เวอร์ชันองค์กร
ChainNewsAbmedia3 ชั่วโมง ที่แล้ว