ตามรายงานทางเทคนิคของ DeepSeek เมื่อวันที่ 30 เมษายน บริษัทได้เปิดตัว Visual Primitives ซึ่งเป็นวิธีการที่ฝังหน่วยภาพพื้นฐาน เช่น จุดและกล่องครอบ (bounding boxes) ลงในสายการให้เหตุผล เพื่อแก้ปัญหา Reference Gap ในงานมัลติโหมด วิธีนี้ช่วยลดการใช้โทเคนของภาพผ่านการบีบอัด KV cache
ในการทดสอบด้านการนับและการให้เหตุผลเชิงพื้นที่ แนวทางดังกล่าวให้ผลเทียบเท่ากับ GPT-5.4, Claude-Sonnet-4.6 และ Gemini-3-Flash ในมิติบางส่วน DeepSeek ระบุว่าจะเปิดซอร์สส่วนหนึ่งของเกณฑ์การประเมินและชุดข้อมูล โดยจะปล่อยน้ำหนักโมเดลหลังจากมีการบูรณาการ
btc.bar.articles
Forefront Tech เสร็จสิ้นการกำหนดราคาการเสนอขาย IPO ของ $100M แล้ว เข้าจดทะเบียนใน Nasdaq ภายใต้รหัส FTHAU
ตามรายงานของ ChainCatcher บริษัทจัดหาทุนเพื่อการเข้าซื้อกิจการเฉพาะวัตถุประสงค์ Forefront Tech ได้กำหนดราคาเสนอขายหุ้น IPO มูลค่า 100 ล้านดอลลาร์สหรัฐเสร็จสิ้นเมื่อวันที่ 30 เมษายน และจะเข้าจดทะเบียนใน Nasdaq ภายใต้สัญลักษณ์ FTHAU บริษัทวางแผนจะนำเงินที่ได้ไปใช้แสวงหาโอกาสในการควบรวมกิจการและการเข้าซื้อกิจการในบล็อกเชน, ฟินเทค, ปัญญาประดิษฐ์ และ
GateNews31 นาที ที่แล้ว
Anthropic Claude Code เรียกเก็บเงินเกินจากผู้ใช้ 200.98 ดอลลาร์สหรัฐเนื่องจากบั๊กระบบเรียกเก็บเงิน โดยในตอนแรกปฏิเสธการคืนเงินก่อนจะชดเชยเต็มจำนวน
จากการติดตามของ Beating บั๊กด้านการเรียกเก็บเงินในบริการ Claude Code ของ Anthropic ทำให้สมาชิกแบบ Max เกินไปถึง 20x ถูกเรียกเก็บเงินเกิน $200.98 สำหรับค่าธรรมเนียมการใช้งานเพิ่มเติม ทั้งที่ใช้งานเพียง 13% ของโควต้ารายเดือน บั๊กดังกล่าวถูกกระตุ้นเมื่อประวัติ commit ของคลังโค้ด git ของผู้ใช้มีตัวอักษรพิมพ์ใหญ่
GateNews1 ชั่วโมง ที่แล้ว
NVIDIA เปิดตัวน้ำหนักโมเดลเรือธง Cosmos-Reason2-32B และขยายขนาดบริบทเป็น 256K โทเค็น
ตาม Beating NVIDIA ได้เปิดตัวน้ำหนัก (weights) สำหรับ Cosmos-Reason2-32B ซึ่งเป็นรุ่นเรือธงของโมเดลการให้เหตุผลเชิงกายภาพด้านวิสัยทัศน์-ภาษา (VLM) ที่ออกแบบมาเพื่อช่วยให้หุ่นยนต์และระบบขับเคลื่อนอัตโนมัติเข้าใจหลักการเชิงพื้นที่ เชิงเวลา และเชิงกายภาพ โมเดลพารามิเตอร์ 32 พันล้าน ซึ่ง
GateNews1 ชั่วโมง ที่แล้ว
OpenAI เปิดเผยว่าเหตุใด Codex จึงห้ามพูดคำว่า “ก็อบลิน”: การให้รางวัลบุคลิกแบบนักเนิร์ดหลุดการควบคุม
OpenAI ในบล็อกทางการได้อธิบายว่า Codex ถูกห้ามไม่ให้พูดถึงสิ่งมีชีวิตจำพวกก็อบลินและสิ่งมีชีวิตอื่น ๆ เนื่องมาจากสัญญาณรางวัลที่ชอบการเปรียบเทียบกับสิ่งมีชีวิตในกระบวนการฝึกบุคลิกของ “คนขี้หมกมุ่น” ทำให้เกิดการปนเปื้อนข้ามบุคลิกและทำให้ RLHF เข้าใจผิด เหตุการณ์นี้ถูกเปิดโปงโดย Barron Roth หลังจากที่มีการเผยคำสั่งระบบ จากนั้น OpenAI จึงใช้สองกลยุทธ์ ได้แก่ การฮาร์ดโค้ดแบบระยะสั้นและการล้างสัญญาณรางวัลในระยะยาว เพื่อเตือนถึงความเปราะบางของการออกแบบสัญญาณรางวัล และการตรวจสอบหลังการฝึกจำเป็นต้องละเอียดมากขึ้น
ChainNewsAbmedia2 ชั่วโมง ที่แล้ว
โมดูลการตีความ Qwen-Scope แบบโอเพนซอร์สของ Alibaba เปิดเผยแล้ว ครอบคลุม 7 โมเดล ในวันที่ 30 เมษายน
ตาม PANews เมื่อวันที่ 30 เมษายน Qwen ของ Alibaba ได้ประกาศการเปิดซอร์ส Qwen-Scope ซึ่งเป็นโมดูลด้านความสามารถในการตีความ (interpretability) ที่ฝึกบนโมเดลตระกูล Qwen3 และ Qwen3.5 โดยการเปิดตัวครอบคลุมโมเดลภาษาขนาดใหญ่ 7 รุ่น ทั้งในแบบ dense และแบบ mixture-of-experts พร้อมด้วย sparse autoencoder จำนวน 14 ชุด
GateNews3 ชั่วโมง ที่แล้ว
เซิร์ฟเวอร์ AI ของ Nvidia B300 ทำยอดทะลุ 1 ล้านดอลลาร์ในจีน ท่ามกลางภาวะขาดแคลนอุปทาน
ตามรายงานของ Reuters เซิร์ฟเวอร์ AI B300 ของ Nvidia ขณะนี้ขายได้ในจีนในราคาโดยประมาณ 7 ล้านหยวน (1 ล้านดอลลาร์สหรัฐ) โดยได้รับแรงหนุนจากการปราบปรามเครือข่ายลักลอบนำเข้าอย่างเข้มงวด และความต้องการที่ยังคงสูงจากบริษัทเทคโนโลยีท้องถิ่น ราคาดังกล่าวพุ่งขึ้นจากราว 4 ล้านหยวน (585,000 ดอลลาร์สหรัฐ) ในช่วงปลายปี 2025 อย่างมีนัยสำคัญ
GateNews3 ชั่วโมง ที่แล้ว