Google phát hành mô hình AI mạnh nhất của mình, Gemini 3—Dưới đây là những điều bạn cần biết

2025-11-18 18:03:00

Trung tâm Nghệ thuật, Thời trang và Giải trí của Decrypt.

Khám phá SCENE

Google đã phát hành Gemini 3 Pro trong một buổi xem trước công khai hôm nay, gọi đây là mô hình AI mạnh mẽ nhất của công ty cho đến nay. Hệ thống xử lý văn bản, hình ảnh, âm thanh và video đồng thời trong khi xử lý lên đến 1 triệu token ngữ cảnh—xấp xỉ tương đương với 700.000 từ, hoặc khoảng 10 tiểu thuyết dài.

Mô hình xem trước có sẵn miễn phí cho bất kỳ ai thử ở đây.

Google cho biết mô hình này đã vượt trội hơn người tiền nhiệm của nó, Gemini 2.5 Pro, trong hầu hết các tiêu chuẩn mà công ty thử nghiệm. Trong kỳ thi cuối cùng của nhân loại, một bài kiểm tra lý luận học thuật, Gemini 3 Pro ghi được 37,5% so với 21,6% của 2.5 Pro. Trên ARC-AGI-2, một tiêu chuẩn câu đố lý luận hình ảnh, khoảng cách càng được nới rộng: 31,1% so với 4,9%.

Tất nhiên, thách thức thực sự ở giai đoạn này trong cuộc đua AI không phải là vấn đề kỹ thuật nhiều như là việc giành được thị phần thương mại.

Google, từng dường như bất khả chiến bại trong lĩnh vực tìm kiếm, đã nhường lại một lượng lớn thị phần cho OpenAI, đơn vị tuyên bố có khoảng 800 triệu người dùng hàng tuần ChatGPT so với Gemini, đơn vị được cho là có khoảng 650 triệu người dùng hàng tháng. Google chưa công bố số liệu người dùng hàng tuần của mình, nhưng con số đó chắc chắn sẽ ít hơn nhiều so với số lượng hàng tháng.

Tuy nhiên, những thành tựu kỹ thuật của Gemini 3 thật ấn tượng.

Giới thiệu Gemini 3 — mô hình thông minh nhất của chúng tôi giúp bạn hiện thực hóa bất kỳ ý tưởng nào.

Gemini 3 là bước tiếp theo của chúng tôi trên con đường hướng tới AGI và có:

🧠 Lập luận tiên tiến nhất

🖼️ Hiểu biết sâu sắc đa phương thức

💻 Mã hóa mạnh mẽ để bạn có thể chuyển từ lời nhắc sang ứng dụng chỉ trong một lần… pic.twitter.com/zG8r95pGcS

— Google (@Google) Ngày 18 tháng 11 năm 2025

Gemini 3 Pro sử dụng kiến trúc hỗn hợp chuyên gia thưa mà Google gọi là. Thay vì kích hoạt tất cả hơn 1 triệu tham số cho mỗi truy vấn, hệ thống định tuyến từng đầu vào đến các mạng con chuyên biệt. Chỉ một phần của mô hình—chuyên gia cho nhiệm vụ cụ thể đó—hoạt động tại bất kỳ thời điểm nào, giảm chi phí tính toán trong khi vẫn duy trì hiệu suất.

Khác với GPT và Claude, những mô hình lớn và dày đặc (một người đa năng), cách tiếp cận của Google hoạt động như một tổ chức lớn. Một công ty với 1.000 nhân viên không gọi mọi người đến mọi cuộc họp; các đội cụ thể xử lý các vấn đề cụ thể. Gemini 3 Pro hoạt động theo cách tương tự, định hướng các câu hỏi đến các mạng chuyên gia phù hợp.

Google đã đào tạo mô hình trên các tài liệu web, kho mã, hình ảnh, tệp âm thanh và video—cùng với dữ liệu tổng hợp được tạo ra bởi các hệ thống AI khác. Công ty đã lọc dữ liệu đào tạo để đảm bảo chất lượng và an toàn, loại bỏ nội dung khiêu dâm, tài liệu bạo lực và bất kỳ nội dung nào vi phạm luật bảo vệ trẻ em. Việc đào tạo diễn ra trên các Đơn vị Xử lý Tensor của Google sử dụng phần mềm JAX và ML Pathways.

Một thử nghiệm nhanh về mô hình cho thấy nó rất khả thi. Trong bài kiểm tra mã hóa thông thường của chúng tôi yêu cầu tạo một trò chơi lén lút, đây là mô hình đầu tiên tạo ra một trò chơi 3D thay vì trải nghiệm 2D. Các lần chạy khác cung cấp các phiên bản 2D, nhưng tất cả đều hoạt động và nhanh chóng.

Cách tiếp cận này theo phong cách của ChatGPT hoặc Perplexity, khuyến khích các tương tác tiếp theo bằng cách chia sẻ các câu hỏi và gợi ý, nhưng cách triển khai của Google thì sạch sẽ và hữu ích hơn rất nhiều.

Trong quá trình tạo mã, giao diện cung cấp các mẹo để hỗ trợ trong các yêu cầu tiếp theo, giúp người dùng hướng dẫn mô hình tạo ra mã tốt hơn, sửa lỗi và cải thiện logic, giao diện người dùng của ứng dụng, v.v. Nó cũng cung cấp cho người dùng tùy chọn triển khai mã của họ và các ứng dụng được hỗ trợ bởi Gemini.

Tổng thể, mô hình này dường như đặc biệt tập trung vào các nhiệm vụ lập trình. Sáng tạo không phải là điểm mạnh của nó, nhưng nó có thể dễ dàng được hướng dẫn bằng một lời nhắc hệ thống tốt và các ví dụ, vì nó có một cửa sổ ngữ cảnh token rất lớn.

Một phiên bản lưu trữ của thẻ mô hình Gemini 3—một tài liệu cung cấp thông tin thiết yếu về thiết kế của mô hình, mục đích sử dụng, hiệu suất và giới hạn—được xuất bản bởi Google DeepMind cho thấy Gemini 3 Pro có thể tạo ra tối đa 64.000 token đầu ra và duy trì thời điểm cắt kiến thức vào tháng 1 năm 2025. Google thừa nhận rằng mô hình có thể phát sinh thông tin không chính xác và đôi khi gặp phải sự chậm trễ hoặc thời gian chờ.

Hiện tại không có thẻ mô hình chính thức.

Như đã đề cập, Google AI Studio hiện đang cung cấp cho mọi người quyền truy cập miễn phí vào Gemini 3 Pro. Vertex AI và API Gemini cũng hỗ trợ mô hình này. Gemini 3 Pro vẫn chưa khả dụng qua ứng dụng Gemini, tuy nhiên—không ngay cả cho các thuê bao Gemini Pro trả phí.

Bản phát hành tháng 11 đưa Google đối đầu với Claude Sonnet 4.5 của Anthropic, Grok 4.1 và thậm chí là GPT-5.1 của OpenAI. Điểm chuẩn cho thấy Gemini 3 Pro dẫn đầu trong các nhiệm vụ suy luận và đa phương thức, mặc dù hiệu suất thực tế khác nhau tùy theo trường hợp sử dụng.

Google đã phân phối Gemini 3 Pro thông qua các nền tảng đám mây của mình theo các điều khoản dịch vụ hiện có. Chính sách cấm sử dụng AI sinh ra của công ty áp dụng, ngăn chặn việc sử dụng trong các hoạt động nguy hiểm, vi phạm an ninh, nội dung khiêu dâm, bạo lực, phát ngôn thù hận và thông tin sai lệch.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.