DeepSeek V4 Đạt Điểm Hoàn Hảo Trên Putnam-2025, Hòa Với Axiom Trong Suy Luận Toán Học Chính Thức

Tin tức từ Gate, ngày 24 tháng 4 — DeepSeek V4 đã công bố kết quả từ các bài đánh giá suy luận toán học chính thức, đạt điểm tuyệt đối 120/120 trên Putnam-2025, hòa với Axiom ở vị trí số 1.

Trong chế độ thực dụng sử dụng LeanExplore và lấy mẫu bị ràng buộc, V4-Flash-Max đạt 81.00 trên chuẩn điểm Putnam-200 Pass@8, vượt trội đáng kể so với Seed-2.0-Prover (35.50), Gemini 3 Pro (26.50) và Seed-1.5-Prover (26.50). Kết quả ở chế độ biên cho thấy V4 đứng trước Seed-1.5-Prover (110/120) và Aristotle (100/120).

V4 sử dụng một cách tiếp cận suy luận lai chính thức-vô chính thức: suy luận vô chính thức tạo ra các giải pháp ứng viên bằng ngôn ngữ tự nhiên, tự kiểm chứng lọc các kết quả, và tác nhân chính thức hoàn thiện các phép chứng chặt chẽ trong Lean. Kết quả ở chế độ biên sử dụng khả năng mở rộng tính toán quy mô lớn, trong khi điểm số ở chế độ thực dụng phản ánh tốt hơn năng lực triển khai tiêu chuẩn.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Đồng sáng lập NeoSoul Kaelan: Ngành AI nên cho phép sự tồn tại của đồ chơi, đổi mới thường bắt đầu từ các sản phẩm thử nghiệm

Tin tức Gate, ngày 24 tháng 4 — Tại một diễn đàn gần đây ở Hồng Kông về tài chính mã hóa thông minh, đồng sáng lập NeoSoul Kaelan đã chia sẻ những hiểu biết về việc đánh giá các dự án AI ở giai đoạn đầu, trong ngành AI phát triển nhanh chóng và liên tục thay đổi. Ngoài việc đánh giá các sản phẩm hiện tại, các nhóm phải chứng minh khả năng bắt kịp với các năng lực của mô hình nền tảng, ông cho biết. Kaelan nhấn mạnh rằng khởi nghiệp AI cần cả sự vững nền và tầm nhìn: vững nền nghĩa là có năng lực về triển khai kỹ thuật, thiết kế sản phẩm và hiểu biết thị trường để tạo ra các sản phẩm hữu hình; tầm nhìn nghĩa là xây dựng phù hợp với các xu hướng phát triển của các mô hình ngôn ngữ lớn. Kaelan lập luận rằng dù một số sản phẩm AI giai đoạn đầu có thể trông như đồ chơi, những hình thức như vậy nên được cho phép trong các ngành công nghiệp đang hình thành. Nhiều mô hình hoàn toàn mới thực sự lần đầu tiên xuất hiện dưới dạng sản phẩm thử nghiệm trước khi đạt đến độ trưởng thành.

GateNews12phút trước

Meta và Amazon Thống Nhất Thỏa Thuận Trị Giá Nhiều Tỷ Đô La để Cung Cấp Chip Graviton cho Phát Triển AI

Tin tức cổng, ngày 24 tháng 4 — Meta Platforms và Amazon Web Services (AWS) đã đạt được một thỏa thuận trị giá nhiều tỷ đô la để hỗ trợ các sáng kiến trí tuệ nhân tạo của Meta trong những năm tới, theo Wall Street Journal. Theo thỏa thuận này, Meta sẽ sử dụng hàng chục triệu lõi chip AWS Graviton c

GateNews23phút trước

DeepSeek V4-Flash lên Ollama Cloud, máy chủ Mỹ: Claude Code, OpenClaw tích hợp một lần

Ollama Cloud đã niêm yết DeepSeek V4-Flash, suy luận trên máy chủ tại Mỹ, cung cấp ba bộ lệnh một lần để kết nối Claude Code, OpenClaw, Hermes. V4-Flash/V4-Pro sử dụng kiến trúc MoE, hỗ trợ nguyên sinh ngữ cảnh 1M, và giảm chi phí bằng nén theo Token-wise + chú ý thưa DSA; trong bối cảnh 1M, FLOPs cho mỗi token giảm 27%, bộ nhớ đệm KV giảm 10%. API tương thích với OpenAI ChatCompletions và Anthropic, giúp chuyển đổi dễ dàng giữa nhiều quy trình làm việc, đồng thời giảm chi phí và rủi ro về chủ quyền dữ liệu.

ChainNewsAbmedia1giờ trước

Web3 AI Infrastructure AIW3 huy động $2M trong vòng seed do Buffalo Capital dẫn dắt

Tin tức từ Gate, ngày 24 tháng 4 — Nền tảng hạ tầng Web3 AI AIW3 thông báo hoàn tất vòng gọi vốn seed trị giá $2 triệu đô la. Vòng này do Buffalo Capital dẫn dắt, với GalaXin Capital và Three-stones Ventures tham gia với vai trò đồng đầu tư. AIW3 đang chuyển dịch sang mô hình thực thi trên chuỗi Agent-as-a-Service

GateNews2giờ trước

Cohere Mua Lại Công Ty AI của Đức Aleph Alpha, Nhận Được $600M Đầu Tư để Mở Rộng Tại Châu Âu

Tin tức Gate, ngày 24 tháng 4 — Công ty AI của Canada Cohere đã công bố kế hoạch mua lại công ty AI của Đức Aleph Alpha để củng cố sự hiện diện của mình tại châu Âu. Schwarz Group, một nhà đầu tư hậu thuẫn của Aleph Alpha, dự kiến sẽ đầu tư $600 triệu USD vào vòng gọi vốn Series E của Cohere. Vòng gọi vốn dự kiến sẽ được hoàn tất vào năm 202

GateNews2giờ trước

Xpeng, Xiaomi dẫn đầu làn sóng AI trên xe tại Triển lãm Ô tô Bắc Kinh

Tin tức cổng, 24 tháng 4 — Các nhà sản xuất ô tô Trung Quốc đã trưng bày các hệ thống AI nâng cao trên xe tại Triển lãm Ô tô Bắc Kinh vào ngày 24 tháng 4, khi quốc gia này đẩy nhanh chiến lược AI Plus và tìm kiếm mức độ độc lập cao hơn khỏi các chất bán dẫn nước ngoài. Xpeng đã trình diễn tính năng đỗ xe điều khiển bằng giọng nói cho phép người lái xe “

GateNews3giờ trước
Bình luận
0/400
Không có bình luận