ข้อความ Gate News วันที่ 24 เมษายน — จางฉี อดีตวิศวกรทีม Seed ของ ByteDance และปัจจุบันเป็นผู้ช่วยศาสตราจารย์ที่มหาวิทยาลัยปักกิ่ง ได้เปิดเผยในพอดแคสต์ “Into Asia” ว่า ByteDance ใช้เวลาประมาณหกเดือนในการทำวงจรเต็มรูปแบบของการฝึกพรีเทรนโมเดลภาษาขนาดใหญ่ (pretraining รวมถึงการฝึกหลังการฝึก) ขณะที่ Google มีรายงานว่าใช้เวลาเพียงสามเดือนเท่านั้น จางมองว่าส่วนต่างด้านความเร็วนี้เป็นเหตุผลหลักประการหนึ่งที่ทำให้บริษัทจีนประสบปัญหาในการตามให้ทันในการพัฒนา AI
จางได้บรรยายถึง “วัฒนธรรมการตั้งตัวชี้วัด” ภายใน Seed โดยหัวหน้าทีมจะได้รับการประเมินจากคะแนนตัวชี้วัดที่พวกเขาดูแล และสมาชิกทุกคนมุ่งเน้นการเร่งตัวเลข อย่างไรก็ตาม เขาระบุว่าสิ่งนี้ไม่ได้แปลเป็นประสบการณ์ผู้ใช้ที่ดีขึ้นในทางปฏิบัติ แม้โมเดลของบริษัทจีนรายใหญ่จะดูแข่งขันได้กับโมเดลแนวหน้าของสหรัฐฯ บนกระดาษ แต่กลับไม่ถึงระดับในสภาพการใช้งานจริง เป้าหมายของ Seed คือการก้าวไปสู่ระดับสมรรถนะชั้นนำระดับโลก แต่จางกล่าวว่าเขาไม่เชื่อว่าทีมได้ทำได้ และยังไม่บรรลุเป้าหมายด้านความเป็นผู้นำในประเทศ
ช่วงปลายปี 2024 Seed มองว่าตัวเองเทียบเท่ากับ GPT-4o แต่หลังจากการเปิดตัวของ DeepSeek ทีมกลับตระหนักว่ายังมีช่องว่างอยู่ เมื่อจางเข้าร่วม กลุ่มทั้งหมดกำลังเร่งปรับเปลี่ยนทิศทางไปสู่การเรียนรู้แบบเสริมแรงเพื่อแก้ไขข้อบกพร่องอย่างเร่งด่วน
btc.bar.articles
การประเมินมูลค่าก่อนเข้าตลาด (Pre-IPO) ของ Anthropic พุ่งแตะ 1.2 ล้านล้านดอลลาร์ แซง OpenAI ไปแล้ว 20%
ตามรายงานของ Odaily มูลค่าที่คาดการณ์โดยปริยายของ Anthropic ในตลาดก่อนเข้าตลาดหลักทรัพย์แบบใช้บล็อกเชนแตะ 1.2 ล้านล้านดอลลาร์สหรัฐ แซงหน้า OpenAI อยู่ราว 20% หากบริษัทเข้าจดทะเบียนในตลาดหลักทรัพย์ด้วยมูลค่านี้ ก็จะติดอันดับบริษัทที่จดทะเบียนในตลาดหลักทรัพย์ขนาดใหญ่ที่สุดทั่วโลกเป็นอันดับ 11 ตามมูลค่าหลักทรัพย์ตามราคาตลาด โดยอยู่หลัง Apple,
GateNews2 นาที ที่แล้ว
ตลาดหุ้นเกาหลีใต้พุ่งเร็วกว่า ตลาดโลก ท่ามกลางกระแสบูม AI
ตลาดหุ้นเกาหลีใต้กำลังทำสถิติปรับขึ้นอย่างไม่เคยเกิดขึ้นมาก่อน โดยแรงหนุนมาจากหุ้นเซมิคอนดักเตอร์ที่เกี่ยวข้องกับปัญญาประดิษฐ์ โดยดัชนี KOSPI ปรับขึ้น 78% ตั้งแต่ต้นปี ซึ่งทำผลงานได้ดีกว่าตลาดหลักอื่น ๆ ทั่วโลกทั้งหมด ตามข้อมูลของ Financial Modeling Prep ที่ถูกอ้างในบทวิเคราะห์ของ Axios
AI
CryptoFrontier10 นาที ที่แล้ว
DeepL ลดพนักงาน 25% (ประมาณ 250 คน) เพื่อปรับโครงสร้างธุรกิจ AI
ตามรายงานของ Bloomberg บริษัทผู้พัฒนาเครื่องมือแปลภาษาอย่าง DeepL ประกาศในวันนี้ 7 พฤษภาคมว่าจะปลดพนักงานประมาณ 25% ของทั้งองค์กร หรือราว 250 คน เพื่อปรับตัวให้เข้ากับการเปลี่ยนแปลงเชิงโครงสร้างที่ขับเคลื่อนโดยปัญญาประดิษฐ์ โดย CEO Jarek Kutylowski ระบุบน LinkedIn ว่าบริษัทจะลดจำนวนฝ่ายบริหาร
GateNews40 นาที ที่แล้ว
NVIDIA เปิดตัว Nemotron 3 Nano Omni แบบโอเพนซอร์สหลายรูปแบบ
NVIDIA เปิดเผย Nemotron 3 Nano Omni ซึ่งเป็นโมเดลมัลติโหมดแบบโอเพนซอร์ส โดยรวมการมองเห็น คำพูด และภาษาไว้ในโมเดลเดียว เพื่อทำหน้าที่เป็นชั้นการรับรู้ของ AI agent โดยแกนหลักคือ 30B-A3B MoE, context ขนาด 256K, อัตราการไหลงาน 9x รองรับอินพุตได้ทั้งข้อความ ภาพ เสียง และวิดีโอ เป็นต้น โดยผลลัพธ์เป็นข้อความ ร่วมกับ Nemotron 3 Super/Ultra เพื่อใช้งานในสถานการณ์ต่างๆ เช่น การควบคุมคอมพิวเตอร์อย่างอัจฉริยะ การเข้าใจเอกสาร และการเข้าใจภาพและเสียง พร้อมทั้งเผยแพร่น้ำหนักโมเดลและข้อมูลการฝึก เพื่อนำไปใช้งานได้ครอบคลุมทั้งบนเครื่องของผู้ใช้ NIM และแพลตฟอร์มของบุคคลที่สาม
ChainNewsAbmedia1 ชั่วโมง ที่แล้ว
Cursor เปิดเผยวิธีฝึกอบรมการติดตั้งอัตโนมัติ เพิ่มประสิทธิภาพ Composer 2 ขึ้น 14 จุดเปอร์เซ็นต์
ตามการเปิดเผยล่าสุดของ Cursor บริษัทได้เปิดตัวเทคนิคการฝึกที่เรียกว่า autoinstall สำหรับกลุ่มโมเดล Composer โดยใช้โมเดลรุ่นก่อนเพื่อกำหนดค่าสภาพแวดล้อมที่สามารถรันได้โดยอัตโนมัติสำหรับการเรียนรู้แบบเสริมแรงของรุ่นถัดไป เมื่อฝึก Composer 2, Cursor
GateNews1 ชั่วโมง ที่แล้ว
งาน OpenAI DevDay 2026 จะจัดขึ้นที่ซานฟรานซิสโกในวันที่ 29/9
OpenAI ประกาศว่า DevDay 2026 จะจัดขึ้นแบบออฟไลน์ในวันที่ 9/29 ที่ซานฟรานซิสโก และมีการจัดประกวดผลงานที่สร้างสรรค์ด้วย GPT-5.5 และ Image Gen โดย Codex จะคัดกรองอัตโนมัติทุกสัปดาห์ 2–3 ชิ้น ผู้ชนะจะได้รับบัตรเข้าร่วมฟรี รวมถึงตั๋วเครื่องบินและที่พักข้ามเมือง งานนี้มุ่งเน้นระบบนิเวศของ GPT‑5.5 และการให้คะแนนการทำงานร่วมกันระหว่างมนุษย์กับเครื่องจักร ผู้เข้าร่วมต้องมีอายุไม่ต่ำกว่า 18 ปีและไม่ใช่ญาติสายตรงของพนักงาน OpenAI สิ่งที่จับตาได้แก่ โมเดลใหม่ การบูรณาการเอเจนต์ และกลยุทธ์แบบหลายคลาวด์
ChainNewsAbmedia1 ชั่วโมง ที่แล้ว