Ant Group mở mã nguồn mô hình Ling-2.6-flash: 104B tham số với 7,4B tham số hoạt động, đạt nhiều mốc SOTA

Tin tức từ Gate, ngày 29 tháng 4 — Trọng số mô hình Ling-2.6-flash của Ant Group hiện đã được mở mã nguồn công khai, trước đây chỉ có sẵn thông qua API. Mô hình có tổng cộng 104 tỷ tham số với 7,4 tỷ tham số được kích hoạt cho mỗi lần suy luận, cửa sổ ngữ cảnh 256K và giấy phép MIT. Các phiên bản độ chính xác BF16, FP8 và INT4 có sẵn trên HuggingFace và ModelScope.

Ling-2.6-flash giới thiệu các cải tiến chú ý tuyến tính lai (hybrid linear attention) so với Ling 2.0, nâng cấp GQA gốc lên kiến trúc hybrid 1:7 MLA kết hợp Lightning Linear, cùng với MoE có độ thưa cực cao. Hiệu suất suy luận vượt đáng kể các mô hình tương đương: tốc độ tạo đỉnh đạt 340 token/giây trên 4 GPU H20, với thông lượng prefill và decode cao hơn khoảng 4 lần so với các mô hình mã nguồn mở tương đương. Các benchmark liên quan đến tác nhân cho thấy hiệu suất mạnh: BFCL-V4, TAU2-bench, SWE-bench Verified (61,2%), Claw-Eval và PinchBench đạt hoặc tiến gần mức SOTA. Trong toàn bộ bộ bài benchmark Artificial Analysis, tổng mức tiêu thụ token chỉ là 15 triệu. Trên AIME 2026, mô hình đạt 73,85%.

Trang web chính thức của Ant Group cũng liệt kê phiên bản flagship Ling-2.6-1T (phiên bản nghìn tỷ tham số) và phiên bản nhẹ (lightweight) Ling-2.6-mini (phiên bản nhẹ), tuy nhiên tính đến thời điểm xuất bản, trọng số của họ vẫn chưa được phát hành trên HuggingFace, chỉ có dòng flash hiện có thể tải xuống.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Quốc vương Charles III gặp sáu CEO công nghệ Mỹ, gồm Jensen Huang, Jeff Bezos và Tim Cook, để thảo luận quỹ khởi nghiệp của Vương quốc Anh

Tin tức Gate, ngày 29 tháng 4 — Trong chuyến thăm cấp nhà nước tới Hoa Kỳ, Quốc vương Charles III đã gặp sáu nhà lãnh đạo công nghệ Mỹ hàng đầu tại Blair House ở Washington: CEO NVIDIA Jensen Huang, người sáng lập Amazon Jeff Bezos, CEO Apple Tim Cook, CEO AMD Su Zifeng, CEO Salesforce Marc Benioff, và

GateNews1phút trước

Lượng giao hàng kính thông minh AR toàn cầu tăng 98% trong năm 2025, nhờ công nghệ màn hình Ray-Ban Display và waveguide của Meta

Tin tức từ Gate, ngày 29 tháng 4 — Lượng giao hàng kính thông minh thực tế tăng cường (AR) toàn cầu đã tăng 98% trong năm 2025, và lượng giao hàng nửa cuối năm tăng 148% so với cùng kỳ năm trước, theo Counterpoint Research. Mức tăng được thúc đẩy bởi việc mở rộng sản lượng

GateNews13phút trước

Nhà giao dịch quỹ phòng hộ huyền thoại chia sẻ về P/E của cổ phiếu Mỹ: Trong vài năm tới, những người mua toàn bộ thị trường sẽ rất khó để thu được lợi nhuận

Quản lý quỹ phòng hộ Paul Tudor Jones (Jones) nhận phỏng vấn, cảnh báo rằng khoảng trống trong quản lý AI có thể mang lại hậu quả thảm khốc vì nó phá vỡ—rủi ro theo mô hình lặp lại-rút lui chưa từng thấy. Ông cũng chỉ ra rằng tỷ lệ vốn hóa thị trường của cổ phiếu Mỹ so với GDP đạt 252%, và hệ số P/E đang ở mức cao; đầu tư dài hạn vào toàn bộ thị trường khó có lợi nhuận. Ông dùng phép ẩn dụ quyền anh để nói rằng cơ hội giao dịch hiếm hoi, và kêu gọi sự hợp tác toàn cầu nhằm xây dựng khung quản lý AI.

ChainNewsAbmedia15phút trước

Cognition Thiết Lập Singapore Là Trụ Sở APAC, Nhắm Tới Mở Rộng Khu Vực

Tin tức cổng, ngày 29 tháng 4 — Cognition, công ty khởi nghiệp mã hóa AI đứng sau Devin, đã công bố vào ngày 29 tháng 4 rằng họ sẽ thành lập Singapore làm trụ sở châu Á - Thái Bình Dương để giám sát kế hoạch mở rộng khu vực trên khắp Đông Nam Á, Australia, Ấn Độ và Hàn Quốc. Richard Spence sẽ dẫn dắt các hoạt động APAC

GateNews1giờ trước

Google ký kết thỏa thuận AI bí mật với Lầu Năm Góc, thư công khai của nhân viên phản đối

Theo The Information đưa tin vào ngày 28 tháng 4, Google đã ký một thỏa thuận để cung cấp cho Lầu Năm Góc các mô hình trí tuệ nhân tạo (AI) dùng cho các công việc mật. Tờ New York Times trích dẫn các nguồn tin cho biết rằng thỏa thuận này cho phép Bộ Quốc phòng Mỹ sử dụng AI của Google cho các mục đích hợp pháp của chính phủ, có tính chất tương tự như thỏa thuận triển khai AI mật mà Lầu Năm Góc đã ký hồi tháng trước với OpenAI và xAI.

MarketWhisper1giờ trước

Báo cáo nghiên cứu Crypto của a16z: Tỷ lệ khai thác lỗ hổng DeFi của AI agent đạt 70%

Theo báo cáo nghiên cứu do a16z Crypto công bố vào ngày 29 tháng 4, trong điều kiện AI agent được trang bị kiến thức chuyên ngành có cấu trúc, tỷ lệ tái hiện thành công lỗ hổng thao túng giá Ethereum đạt 70%; trong môi trường sandbox không có bất kỳ kiến thức chuyên ngành nào, tỷ lệ thành công chỉ là 10%. Báo cáo cũng đồng thời ghi nhận các trường hợp AI agent độc lập vượt qua các hạn chế của sandbox để truy cập thông tin giao dịch trong tương lai, và các kiểu thất bại có tính hệ thống của agent khi xây dựng các kế hoạch tấn công nhiều bước có khả năng sinh lời.

MarketWhisper1giờ trước
Bình luận
0/400
Không có bình luận