NVIDIA ra mắt AI mã nguồn mở mạnh nhất của Mỹ, chỉ số thông minh 48, kém mẫu Kimi

2026-06-02 03:28:58

Giám đốc điều hành NVIDIA Jensen Huang đã công bố Nemotron 3 Ultra trong bài phát biểu chủ đề tại Triển lãm máy tính Đài Bắc (Computex) vào ngày 1 tháng 6. Đây là một mô hình trọng số mở (open-weight) nhận được 48 điểm chỉ số thông minh trong đợt đánh giá thử nghiệm được Artificial Analysis và NVIDIA phối hợp thực hiện, nhưng thua Kimi K2.6 của Moonshot AI (Trung Quốc) với 54 điểm.

Nemotron 3 Ultra: Thông số kỹ thuật—55 tỷ tham số hoạt động, cửa sổ ngữ cảnh hàng triệu token và xuất xưởng ngày 4 tháng 6

Nemotron 3 Ultra sử dụng kiến trúc chuyên gia hỗn hợp (MoE): tổng tham số 5.500 tỷ, tại mọi thời điểm chỉ kích hoạt 55 tỷ tham số hoạt động, kết hợp lớp Mamba-2, cơ chế chú ý Transformer tiêu chuẩn và định tuyến chuyên gia hỗn hợp. Mô hình hỗ trợ cửa sổ ngữ cảnh 1 triệu token và ứng dụng công nghệ dự đoán đa token (MTP) để cải thiện tốc độ tạo sinh.

NVIDIA cho biết, so với các mô hình trọng số mở cùng nhóm, Ultra có tốc độ suy luận nhanh gấp 5 lần và chi phí thấp hơn 30%. Trên các endpoint tiền phát hành của DeepInfra, mô hình có thể xử lý hơn 300 token đầu ra mỗi giây; trong khi đó, DeepSeek V4 Pro và Kimi K2.6 chỉ xử lý 50 đến 100 token mỗi giây thông qua API thương mại. Trọng số mô hình được công khai, kế hoạch huấn luyện đã được công bố, và ngày xuất xưởng chính thức là 4 tháng 6 năm 2026.

So sánh trực tiếp chỉ số thông minh AI mã nguồn mở giữa Mỹ và Trung Quốc: Dữ liệu từ Artificial Analysis

Theo dữ liệu đánh giá do Artificial Analysis công bố, bảng xếp hạng chỉ số thông minh của các mô hình chính như sau: các mô hình cờ rông đóng (Anthropic, Google, OpenAI) toàn cầu đều đạt 57 điểm; Kimi K2.6 (Moonshot AI, Trung Quốc, ra mắt tháng 4 năm 2026) đạt 54 điểm, xếp thứ 4 toàn cầu; Nemotron 3 Ultra (NVIDIA, Mỹ) đạt 48 điểm, đứng đầu trong nhóm mã nguồn mở tại Mỹ; Google Gemma 4 31B (Mỹ) đạt 39 điểm; Nemotron 3 Super (NVIDIA, tháng 3 năm 2026, 120B tham số) đạt 36 điểm; OpenAI gpt-oss-120b (Mỹ) đạt 33 điểm. Chỉ số thông minh là chuẩn tổng hợp dựa trên 10 hạng mục đánh giá (suy luận, mã hóa, kiến thức chung, hiệu năng tác nhân), điểm càng cao thì càng mạnh.

Liên minh Nemotron và Nemotron 4: Khung phát triển thế hệ kế tiếp đã được xác nhận

NVIDIA đồng thời thông báo tại Triển lãm máy tính Đài Bắc rằng Nemotron 4 đang được phát triển. Nemotron 4 do Nemotron Alliance, được NVIDIA thành lập vào tháng 3 năm 2026, phụ trách. Thành viên gồm 8 phòng thí nghiệm AI, trong đó có Mistral AI và Perplexity, cùng phát triển dựa trên hạ tầng điện toán đám mây DGX.

Trước đó, NVIDIA đã công khai kế hoạch đầu tư 26 tỷ USD vào AI mã nguồn mở trong 5 năm, và Nemotron 3 Ultra là thành quả tiêu biểu nhất tính đến hiện tại. Tỷ trọng sử dụng mã nguồn mở toàn cầu của các mô hình mã nguồn mở Trung Quốc đã tăng từ khoảng 1,2% vào cuối năm 2024 lên khoảng 30% vào cuối năm 2025 (nguồn: Decrypt, báo cáo tháng 3 năm 2026).

Câu hỏi thường gặp

Nemotron 3 Ultra được cải thiện gì so với thế hệ trước Nemotron 3 Super?

Nemotron 3 Super ra mắt vào tháng 3 năm 2026 với 120 tỷ tham số và 36 điểm chỉ số thông minh; Nemotron 3 Ultra có chỉ số thông minh 48 điểm, tăng 12 điểm so với cùng kỳ. NVIDIA cho biết mức tăng 12 điểm là một bước nhảy đáng kể trong lĩnh vực thử nghiệm chuẩn.

Vì sao chỉ số thông minh của Kimi K2.6 cao hơn NVIDIA Nemotron 3 Ultra?

Chỉ số thông minh của Kimi K2.6 của Moonshot AI (Trung Quốc) là 54 điểm, cao hơn 6 điểm so với Nemotron 3 Ultra (48 điểm). Kimi K2.6 xếp thứ 4 trong tất cả các mô hình trên toàn cầu (kể cả các mô hình đóng), chỉ kém 3 điểm so với các mô hình cờ rông đóng flagship của Anthropic, Google và OpenAI (đều 57 điểm). Các phòng thí nghiệm Mỹ như OpenAI, Anthropic và Google có xu hướng giữ mô hình mạnh nhất đứng sau API, trong khi các phòng thí nghiệm Trung Quốc liên tục đóng góp mô hình điểm cao cho hệ sinh thái mã nguồn mở.

Ưu thế về tốc độ của Nemotron 3 Ultra quan trọng nhất trong những kịch bản nào?

Ultra xử lý hơn 300 token đầu ra mỗi giây, nhanh hơn khoảng 3 đến 6 lần so với tốc độ của DeepSeek V4 Pro và Kimi K2.6 trên API thương mại. NVIDIA cho biết ưu thế này đặc biệt quan trọng khi các tác nhân AI tự chủ thực thi các tác vụ nhiều bước trong thời gian dài, vì thời gian chờ mỗi bước sẽ nhanh chóng tích lũy khi tác vụ trở nên phức tạp.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.

Tin tức liên quan

06-02 00:49

CPU Vera 88 lõi của Nvidia sẽ được Anthropic, OpenAI và SpaceX sử dụng; sản xuất đầy đủ trong quý 3

06-02 00:01

MiniMax ra mắt M3, mô hình mã hóa với khả năng chứa 100 triệu token, xử lý nhanh hơn 5 lần vào ngày 1 tháng 6

06-01 22:51

Nvidia ra mắt Nemotron 3 Ultra, là mô hình hàng đầu tại Mỹ Open, nhưng xếp sau Kimi K2.6 của Trung Quốc