DeepSeek V4 Gây Tranh Cãi Ở Mỹ: Think Tank Đặt Câu Hỏi Về Việc Dùng Chip, CEO Replit Bảo Vệ Sự Đổi Mới Mở

Tin tức Cổng thông tin, ngày 24 tháng 4 — Một cuộc tranh luận đã bùng nổ tại Hoa Kỳ về năng lực công nghệ và mức độ tuân thủ của DeepSeek V4. Chris McGuire, một nghiên cứu viên cấp cao tại Hội đồng Quan hệ Đối ngoại (CFR) và là cựu quan chức của Hội đồng An ninh Quốc gia Nhà Trắng cũng như Bộ Quốc phòng, đã đăng tải phân tích cho rằng V4 chưa làm thay đổi bức tranh cạnh tranh AI giữa Mỹ và Trung Quốc. Theo McGuire, chính báo cáo V4 của DeepSeek thừa nhận rằng năng lực suy luận của họ tụt hậu so với các mô hình đầu nguồn (frontier) khoảng 3 đến 6 tháng, dựa trên điểm chuẩn so với GPT-5.2 và Gemini 3.0 Pro được phát hành trước đó sáu tháng.

McGuire nêu lo ngại rằng trong khi báo cáo V4 tiết lộ việc thích ứng ở giai đoạn suy luận với GPU NVIDIA và NPU Huawei Ascend, thì họ không công khai nêu rõ các mẫu GPU hoặc chi phí đào tạo được dùng trong quá trình phát triển. Ông đặt câu hỏi liệu sự im lặng đó có ám chỉ việc sử dụng chip NVIDIA Blackwell chịu kiểm soát xuất khẩu hay không, lưu ý rằng V3 trước đó từng tuyên bố sử dụng 2.000 GPU H800 với chi phí 5,57 triệu USD. DeepSeek đã phủ nhận việc sử dụng Blackwell, cho biết mô hình đã được huấn luyện trên bộ xử lý NVIDIA H800 và Huawei Ascend 910C.

CEO Replit Amjad Masad phản biện phân tích của McGuire, cho rằng các nhà khoa học Trung Quốc đang công khai chia sẻ những đột phá AI thật sự, trong khi các nhà hoạch định chính sách và giới vận động hành lang của Mỹ lại khuếch đại mối lo “chưng cất (distillation) của Trung Quốc”. Masad nhấn mạnh các đổi mới về kiến trúc được nêu trong những tuyên bố chính thức của DeepSeek, bao gồm tính nén sự chú ý ở cấp độ token (DeepSeek Sparse Attention) và những cải thiện hiệu quả đáng kể cho tính toán ngữ cảnh dài. Ông cho biết V4-Pro cho thấy mức tính toán suy luận trên mỗi token và yêu cầu bộ nhớ đệm KV cache thấp hơn đáng kể ở độ dài ngữ cảnh 1M so với V3.2, nhấn mạnh rằng những tiến bộ kiến trúc này không liên quan đến việc chưng cất dữ liệu huấn luyện và rằng mọi nhà nghiên cứu, kể cả các phòng thí nghiệm của Mỹ, đều có thể hưởng lợi từ các phát triển mã nguồn mở.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Xpeng, Xiaomi dẫn đầu làn sóng AI trên xe tại Triển lãm Ô tô Bắc Kinh

Tin tức cổng, 24 tháng 4 — Các nhà sản xuất ô tô Trung Quốc đã trưng bày các hệ thống AI nâng cao trên xe tại Triển lãm Ô tô Bắc Kinh vào ngày 24 tháng 4, khi quốc gia này đẩy nhanh chiến lược AI Plus và tìm kiếm mức độ độc lập cao hơn khỏi các chất bán dẫn nước ngoài. Xpeng đã trình diễn tính năng đỗ xe điều khiển bằng giọng nói cho phép người lái xe “

GateNewsNgay bây giờ

Cựu kỹ sư Seed của ByteDance: Lượt lặp AI của ByteDance mất sáu tháng so với ba tháng của Google

Tin tức Cổng, ngày 24 tháng 4 — Zhang Chi, cựu kỹ sư tại đội Seed của ByteDance và hiện là trợ giảng tại Đại học Bắc Kinh, đã tiết lộ trên podcast "Into Asia" rằng ByteDance cần khoảng sáu tháng để hoàn thành một chu kỳ đầy đủ huấn luyện mô hình ngôn ngữ lớn (pretraining

GateNews17phút trước

Kỹ sư OpenAI Clive Chan Thách thức Khuyến nghị Phần cứng của V4, Trích dẫn Lỗi và Tính Mơ hồ so với V3

Tin tức cổng Gate, ngày 24 tháng 4 — Kỹ sư OpenAI Clive Chan đã đưa ra những phản đối chi tiết đối với chương khuyến nghị phần cứng trong báo cáo kỹ thuật V4, gọi chương này là "đáng ngạc nhiên là tầm thường và dễ gây lỗi" so với phiên bản V3 được ca ngợi. Hướng dẫn phần cứng của V3, bao gồm các buổi Q&A

GateNews48phút trước

Naver Ra Mắt Bản Beta AI Tab Khi Google Gemini Bước Vào Thị Trường Tìm Kiếm Tại Hàn Quốc

Tin tức Cổng, ngày 24 tháng 4 — Naver đã công bố việc bắt đầu thử nghiệm beta kín cho AI Tab, tính năng tìm kiếm hội thoại mới của hãng, sau khi Google ra mắt Gemini trên Chrome tại Hàn Quốc. AI Tab sẽ xuất hiện cùng với các tab tìm kiếm hiện có của Naver, cung cấp cho người dùng một không gian riêng cho các truy vấn mang tính hội thoại

GateNews1giờ trước

Ấn Độ Tuyển dụng Kỹ sư AI Bùng nổ 59,5%, Mở rộng ra Ngoài Các Trung tâm Công nghệ

Báo cáo Thị trường Lao động AI của LinkedIn năm 2026, được phát hành vào ngày 24 tháng 4, cho thấy việc tuyển dụng kỹ sư AI tại Ấn Độ đã tăng 59,5% so với cùng kỳ năm trước, đánh dấu tốc độ nhanh nhất trong số các thị trường được nền tảng này nghiên cứu. Sự tăng trưởng được thúc đẩy bởi nhu cầu lan rộng vượt ra ngoài các trung tâm công nghệ đã được thiết lập. Các thành phố bao gồm

CryptoFrontier1giờ trước

Ngân hàng Commonwealth Cắt Giảm 120 Việc Làm Giữa Đợt Mở Rộng AI

Ngân hàng Commonwealth Bank of Australia thông báo họ sẽ cắt giảm khoảng 120 việc làm khi ngân hàng lớn nhất của quốc gia này rà soát các vị trí và mở rộng việc sử dụng trí tuệ nhân tạo, theo Bloomberg. Các đợt cắt giảm bao gồm 43 vị trí tại Bankwest ở Tây Úc, với sáu vị trí bị ảnh hưởng bởi tự động hóa. Điều này là

CryptoFrontier1giờ trước
Bình luận
0/400
Không có bình luận