Theo phân tích blog mới nhất của Nvidia, GPU Blackwell có chi phí gần gấp đôi theo giờ so với thế hệ Hopper, nhưng lại mang đến chi phí suy luận theo mỗi token thấp hơn 35 lần. Dùng DeepSeek-R1 làm mô hình thử nghiệm, Blackwell (GB300 NVL72) cho thuê ở mức 2,65 USD mỗi GPU mỗi giờ, trong khi Hopper là 1,41 USD. Tuy nhiên, thông lượng trên một GPU tăng từ 90 lên 6.000 token mỗi giây. Mức tăng thông lượng 65 lần này làm giảm chi phí theo 1 triệu token từ 4,20 USD xuống 0,12 USD.
Con số 0,12 USD giả định tối ưu phần mềm đầy đủ, bao gồm suy luận độ chính xác thấp FP4 và dự đoán đa token (MTP). Nếu không bật MTP, chi phí theo 1 triệu token đạt khoảng 2,35 USD, sau đó giảm xuống 0,11 USD khi bật tính năng này, cho thấy chỉ riêng MTP đã tạo ra tác động tối ưu 21 lần.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Kinh doanh AI của Microsoft tăng gấp đôi lên $370B ARR; dự kiến $190B Capex cho năm 2026
Vào ngày 29 tháng 4, Microsoft đã công bố kết quả tài chính quý 3 năm tài khóa 2026 cho giai đoạn kết thúc vào ngày 31 tháng 3, vượt kỳ vọng của thị trường. Doanh thu Q3 đạt 82,886 tỷ USD, tăng 18% so với cùng kỳ năm ngoái và cao hơn mức kỳ vọng 81,4 tỷ USD; lợi nhuận ròng theo GAAP tăng 23% lên 31,778 tỷ USD; lợi nhuận trên mỗi cổ phiếu pha loãng theo không-GAAP
GateNews5phút trước
OpenAI DevDay 2026 sẽ được tổ chức vào 29/9 tại San Francisco
Thông báo chính thức của OpenAI ngày 29/4 cho biết hội nghị nhà phát triển hàng đầu DevDay 2026 sẽ diễn ra vào ngày 29/9 tại San Francisco, quay trở lại hình thức hội nghị trực tiếp sau nhiều năm vắng bóng. Cùng với đó là một hoạt động nhận bài dự thi: nhà phát triển dùng GPT-5.5 và Image Gen để tạo tác phẩm và nộp bài; mỗi tuần, Codex sẽ sàng lọc 2-3 bài nộp mang tính sáng tạo, người đạt sẽ nhận vé miễn phí tham dự DevDay (bao gồm chi phí vé máy bay liên thành phố và khách sạn).
Chủ đề đại hội: hệ sinh thái dành cho nhà phát triển xoay quanh GPT-5.5 + Image Gen
Ngăn xếp ứng dụng cốt lõi của DevDay lần này rõ ràng tập trung vào GPT-5.5. GPT-5.5 ra mắt vào ngày 23/4, mở API toàn diện vào ngày 24/4; cùng với GPT-5.4 vào cuối tháng 4
ChainNewsAbmedia49phút trước
BioMysteryBench: Mythos giải chuyên gia không có lời giải 29,6%
Anthropic ngày 29 tháng 4 đã công bố chính thức BioMysteryBench—một bộ tiêu chí đánh giá mới cho năng lực phân tích sinh tin học của AI, bao gồm các câu hỏi mở dựa trên bối cảnh nghiên cứu thực tế. Dữ liệu đáng chú ý nhất là: trong số những câu hỏi mà nhóm chuyên gia con người vẫn không thể giải được sau khi thử, mô hình chủ lực Mythos của Anthropic giải được 29,6%, còn Opus giải được 27,0%.
Thiết kế đánh giá: song song hai mạch “có thể giải” và “chuyên gia không giải được”
BioMysteryBench gồm hai dạng câu hỏi. Dạng thứ nhất là “có thể giải”—các nhiệm vụ phân tích do nhà nghiên cứu sinh tin học thiết kế, có đáp án chuẩn để đối chiếu; dạng thứ hai là “chuyên gia không giải được”—những câu hỏi mà nhóm chuyên gia con người sau khi thử vẫn không tìm được lời giải đáng tin cậy, nhằm kiểm tra liệu mô hình có thể vượt qua ranh giới kiến thức của lĩnh vực hiện tại hay không.
ChainNewsAbmedia51phút trước
OpenAI Công bố sắp ra mắt mô hình an ninh mạng GPT-5.5-Cyber trong vài ngày tới
Theo Cointelegraph, Sam Altman cho biết OpenAI sẽ ra mắt GPT-5.5-Cyber, một mô hình về an ninh mạng, trong vài ngày tới. Mô hình sẽ được cung cấp cho các nhà bảo vệ an ninh mạng quan trọng, và OpenAI dự định thiết lập các cơ chế truy cập được tin cậy với sự phối hợp của các cơ quan chính phủ để
GateNews1giờ trước
Giám đốc điều hành Google DeepMind dự đoán AGI sẽ xuất hiện vào năm 2030, cho các công ty bốn năm để chuẩn bị
Theo loạt video của Sequoia Capital với sự góp mặt của Demis Hassabis, CEO của Google DeepMind dự đoán trí tuệ nhân tạo tổng quát (AGI) sẽ xuất hiện vào năm 2030. Hassabis, người đoạt Giải Nobel Hóa học năm 2024, coi mốc thời gian này là một thực tế kinh doanh nghiêm ngặt, buộc các nhà lãnh đạo phải suy nghĩ lại cách phát triển sản phẩm de
GateNews1giờ trước
OpenAI vận hành như một công ty lợi nhuận thấp kéo dài, ký hợp đồng mua điện trong 20 năm
Theo Odaily, CEO của OpenAI Sam Altman cho biết tại Stripe Sessions rằng OpenAI đặt mục tiêu trở thành một công ty hạ tầng có lợi nhuận thấp một cách bền vững nhưng quy mô lớn và tăng trưởng nhanh, cung cấp các sản phẩm tương tự như một “công tơ thông minh” mà người dùng có thể mua để tự động hóa hoạt động kinh doanh hoặc nhúng vào
GateNews1giờ trước