DeepSeek เปิดตัววิธี Visual Primitives เพื่อยกระดับการให้เหตุผลแบบมัลติโหมดในวันที่ 30 เมษายน

ตามรายงานทางเทคนิคของ DeepSeek เมื่อวันที่ 30 เมษายน บริษัทได้เปิดตัว Visual Primitives ซึ่งเป็นวิธีการที่ฝังหน่วยภาพพื้นฐาน เช่น จุดและกล่องครอบ (bounding boxes) ลงในสายการให้เหตุผล เพื่อแก้ปัญหา Reference Gap ในงานมัลติโหมด วิธีนี้ช่วยลดการใช้โทเคนของภาพผ่านการบีบอัด KV cache

ในการทดสอบด้านการนับและการให้เหตุผลเชิงพื้นที่ แนวทางดังกล่าวให้ผลเทียบเท่ากับ GPT-5.4, Claude-Sonnet-4.6 และ Gemini-3-Flash ในมิติบางส่วน DeepSeek ระบุว่าจะเปิดซอร์สส่วนหนึ่งของเกณฑ์การประเมินและชุดข้อมูล โดยจะปล่อยน้ำหนักโมเดลหลังจากมีการบูรณาการ

news.article.disclaimer

btc.bar.articles

Forefront Tech เสร็จสิ้นการกำหนดราคาการเสนอขาย IPO ของ $100M แล้ว เข้าจดทะเบียนใน Nasdaq ภายใต้รหัส FTHAU

ตามรายงานของ ChainCatcher บริษัทจัดหาทุนเพื่อการเข้าซื้อกิจการเฉพาะวัตถุประสงค์ Forefront Tech ได้กำหนดราคาเสนอขายหุ้น IPO มูลค่า 100 ล้านดอลลาร์สหรัฐเสร็จสิ้นเมื่อวันที่ 30 เมษายน และจะเข้าจดทะเบียนใน Nasdaq ภายใต้สัญลักษณ์ FTHAU บริษัทวางแผนจะนำเงินที่ได้ไปใช้แสวงหาโอกาสในการควบรวมกิจการและการเข้าซื้อกิจการในบล็อกเชน, ฟินเทค, ปัญญาประดิษฐ์ และ

GateNews31 นาที ที่แล้ว

Anthropic Claude Code เรียกเก็บเงินเกินจากผู้ใช้ 200.98 ดอลลาร์สหรัฐเนื่องจากบั๊กระบบเรียกเก็บเงิน โดยในตอนแรกปฏิเสธการคืนเงินก่อนจะชดเชยเต็มจำนวน

จากการติดตามของ Beating บั๊กด้านการเรียกเก็บเงินในบริการ Claude Code ของ Anthropic ทำให้สมาชิกแบบ Max เกินไปถึง 20x ถูกเรียกเก็บเงินเกิน $200.98 สำหรับค่าธรรมเนียมการใช้งานเพิ่มเติม ทั้งที่ใช้งานเพียง 13% ของโควต้ารายเดือน บั๊กดังกล่าวถูกกระตุ้นเมื่อประวัติ commit ของคลังโค้ด git ของผู้ใช้มีตัวอักษรพิมพ์ใหญ่

GateNews1 ชั่วโมง ที่แล้ว

NVIDIA เปิดตัวน้ำหนักโมเดลเรือธง Cosmos-Reason2-32B และขยายขนาดบริบทเป็น 256K โทเค็น

ตาม Beating NVIDIA ได้เปิดตัวน้ำหนัก (weights) สำหรับ Cosmos-Reason2-32B ซึ่งเป็นรุ่นเรือธงของโมเดลการให้เหตุผลเชิงกายภาพด้านวิสัยทัศน์-ภาษา (VLM) ที่ออกแบบมาเพื่อช่วยให้หุ่นยนต์และระบบขับเคลื่อนอัตโนมัติเข้าใจหลักการเชิงพื้นที่ เชิงเวลา และเชิงกายภาพ โมเดลพารามิเตอร์ 32 พันล้าน ซึ่ง

GateNews1 ชั่วโมง ที่แล้ว

OpenAI เปิดเผยว่าเหตุใด Codex จึงห้ามพูดคำว่า “ก็อบลิน”: การให้รางวัลบุคลิกแบบนักเนิร์ดหลุดการควบคุม

OpenAI ในบล็อกทางการได้อธิบายว่า Codex ถูกห้ามไม่ให้พูดถึงสิ่งมีชีวิตจำพวกก็อบลินและสิ่งมีชีวิตอื่น ๆ เนื่องมาจากสัญญาณรางวัลที่ชอบการเปรียบเทียบกับสิ่งมีชีวิตในกระบวนการฝึกบุคลิกของ “คนขี้หมกมุ่น” ทำให้เกิดการปนเปื้อนข้ามบุคลิกและทำให้ RLHF เข้าใจผิด เหตุการณ์นี้ถูกเปิดโปงโดย Barron Roth หลังจากที่มีการเผยคำสั่งระบบ จากนั้น OpenAI จึงใช้สองกลยุทธ์ ได้แก่ การฮาร์ดโค้ดแบบระยะสั้นและการล้างสัญญาณรางวัลในระยะยาว เพื่อเตือนถึงความเปราะบางของการออกแบบสัญญาณรางวัล และการตรวจสอบหลังการฝึกจำเป็นต้องละเอียดมากขึ้น

ChainNewsAbmedia2 ชั่วโมง ที่แล้ว

โมดูลการตีความ Qwen-Scope แบบโอเพนซอร์สของ Alibaba เปิดเผยแล้ว ครอบคลุม 7 โมเดล ในวันที่ 30 เมษายน

ตาม PANews เมื่อวันที่ 30 เมษายน Qwen ของ Alibaba ได้ประกาศการเปิดซอร์ส Qwen-Scope ซึ่งเป็นโมดูลด้านความสามารถในการตีความ (interpretability) ที่ฝึกบนโมเดลตระกูล Qwen3 และ Qwen3.5 โดยการเปิดตัวครอบคลุมโมเดลภาษาขนาดใหญ่ 7 รุ่น ทั้งในแบบ dense และแบบ mixture-of-experts พร้อมด้วย sparse autoencoder จำนวน 14 ชุด

GateNews3 ชั่วโมง ที่แล้ว

เซิร์ฟเวอร์ AI ของ Nvidia B300 ทำยอดทะลุ 1 ล้านดอลลาร์ในจีน ท่ามกลางภาวะขาดแคลนอุปทาน

ตามรายงานของ Reuters เซิร์ฟเวอร์ AI B300 ของ Nvidia ขณะนี้ขายได้ในจีนในราคาโดยประมาณ 7 ล้านหยวน (1 ล้านดอลลาร์สหรัฐ) โดยได้รับแรงหนุนจากการปราบปรามเครือข่ายลักลอบนำเข้าอย่างเข้มงวด และความต้องการที่ยังคงสูงจากบริษัทเทคโนโลยีท้องถิ่น ราคาดังกล่าวพุ่งขึ้นจากราว 4 ล้านหยวน (585,000 ดอลลาร์สหรัฐ) ในช่วงปลายปี 2025 อย่างมีนัยสำคัญ

GateNews3 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น