Từ mô hình robot tổng quát đến máy tính AI, một cái nhìn nhanh về các sản phẩm mới được phát hành tại GTC của NVIDIA

PANews

2025-03-19 07:04:04

Tác giả: Liu Rui, Tài Liên Xã

Vào lúc 3 giờ chiều ngày 18 tháng 3, thứ Ba, CEO của Nvidia, Huang Renxun, đã có bài phát biểu chính tại hội nghị AI của Nvidia GTC 2025 diễn ra tại San Jose, California.

Trong bài phát biểu kéo dài 2 giờ 20 phút này, Huang Renxun đã dự đoán sự tiến bộ của công nghệ AI và triển vọng nhu cầu tính toán, đồng thời công bố thế hệ sản phẩm mới nhất của kiến trúc Blackwell của NVIDIA, thời gian dự kiến xuất xưởng cho các thế hệ sản phẩm sau, và cũng tiết lộ tiến trình hợp tác nghiên cứu và phát triển giữa NVIDIA và các ông lớn công nghệ khác trong lĩnh vực lái xe tự động, mạng AI và robot.

Mặc dù có rất nhiều thông tin, nhưng phản ứng của Phố Wall đối với bài phát biểu này dường như khá nhạt nhòa. Tính đến khi đóng cửa vào thứ Ba, giá cổ phiếu của Nvidia giảm 3,43%, và tiếp tục giảm 0,56% trong giao dịch sau giờ.

Mơ về tương lai: Nhu cầu tính toán vẫn còn không gian nâng cao lớn

Vào đầu bài phát biểu chính, Huang Renxun đã đưa ra tầm nhìn của mình về trí tuệ nhân tạo dựa trên thời gian phát triển hiện tại của trí tuệ nhân tạo. Ông đã mô tả bốn làn sóng của trí tuệ nhân tạo:

Trí tuệ nhân tạo cảm nhận (Perception AI): Khởi động khoảng 10 năm trước, tập trung vào nhận diện giọng nói và các nhiệm vụ đơn giản khác.
Trí tuệ nhân tạo sinh generative (Generative AI): điểm nhấn trong 5 năm qua, liên quan đến việc tạo ra văn bản và hình ảnh thông qua dự đoán mô hình.
Trí tuệ nhân tạo đại lý (Agentic AI): Giai đoạn hiện tại của trí tuệ nhân tạo tương tác theo cách số và tự thực hiện nhiệm vụ, đặc trưng bởi mô hình suy diễn.
AI Vật lý (Physical AI): Tương lai của AI, cung cấp năng lượng cho robot hình người và các ứng dụng trong thế giới thực.

Huang Renxun chỉ ra rằng ngành công nghiệp trí tuệ nhân tạo đang đối mặt với “những thách thức lớn” về tính toán, ông cho biết rằng ở giai đoạn hiện tại của AI sinh sinh, số lượng tokens và tài nguyên cần thiết cho tính toán gấp 100 lần so với dự kiến ban đầu. Ông giải thích rằng điều này là do các mô hình suy diễn cần tokens trong nhiều bước của quá trình suy diễn.

Tuy nhiên, Huang Renxun kiên quyết cho rằng, phản hồi từ ngành là tích cực, nhu cầu về tính toán nhiều hơn đang được đáp ứng, và nhấn mạnh rằng, chỉ trong một năm ngắn ngủi, một phần của thị trường cơ sở hạ tầng trí tuệ nhân tạo đã cho thấy sự tăng trưởng đáng kinh ngạc.

Ông tiết lộ rằng, vào năm 2024, bốn nhà cung cấp dịch vụ đám mây lớn nhất của Mỹ, được gọi là các nhà cung cấp dịch vụ đám mây quy mô siêu lớn (hyperscaler), đã mua 1,3 triệu chip kiến trúc Hopper của Nvidia, và vào năm 2025, lại mua 3,6 triệu chip kiến trúc Blackwell.

Ông nhấn mạnh rằng cơ sở hạ tầng trung tâm dữ liệu dự kiến sẽ mở rộng nhanh chóng, dự đoán rằng đến cuối năm 2028, chi tiêu vốn cho cơ sở hạ tầng trung tâm dữ liệu sẽ vượt quá 1.000 tỷ USD.

Trình bày lộ trình sản phẩm trong những năm tới

Ngay sau đó, đúng như những gì mà bên ngoài đã dự đoán rộng rãi, Jensen Huang trong bài phát biểu đã xác nhận rằng Nvidia sẽ ra mắt sản phẩm kế nhiệm của dòng GPU Blackwell thế hệ hiện tại - Blackwell Ultra vào nửa cuối năm 2025.

Huang Renxun cho biết: “Blackwell đã hoàn toàn đi vào sản xuất, sự tăng trưởng sản lượng thật khó tin. Nhu cầu của khách hàng thật khó tin… Chúng tôi sẽ dễ dàng chuyển sang phiên bản nâng cấp (Blackwell Ultra).”

Ngoài chip Blackwell Ultra, Nvidia cũng ra mắt siêu chip GB300, kết hợp hai chip Blackwell Ultra và một CPU Grace.

Huang Renxun cũng cho biết, Nvidia sẽ ra mắt thế hệ chip siêu AI tiếp theo Vera Rubin vào nửa cuối năm 2026 và ra mắt chip siêu Vera Rubin Ultra vào nửa cuối năm 2027 - điều này cũng phù hợp với những mong đợi trước đó của giới bên ngoài.

Huang Renxun cũng tiết lộ rằng, thế hệ chip tiếp theo sau chip Rubin sẽ được đặt theo tên của nhà vật lý Richard Feynman, tiếp tục truyền thống đặt tên chip theo tên các nhà khoa học. Theo các slide mà Huang Renxun trình bày, chip Feynman dự kiến sẽ ra mắt vào năm 2028.

Máy tính AI mới ra mắt

Ngoài chip, Huang Renxun còn công bố ra mắt các mẫu laptop và máy tính để bàn mới sử dụng chip của mình, bao gồm hai mẫu máy tính tập trung vào trí tuệ nhân tạo, lần lượt có tên là DGX Spark và DGX Station, chúng sẽ có khả năng chạy các mô hình trí tuệ nhân tạo lớn, chẳng hạn như Llama hoặc DeepSeek.

Trong số đó, DGX Spark là Project Digits lần đầu xuất hiện tại CES, trong khi DGX Station là một máy tính để bàn cấp workstation lớn hơn.

Jensen Huang tuyên bố, DGX Spark là “máy tính siêu nhỏ nhất thế giới”, với kích thước không lớn hơn nhiều so với Mac mini, được trang bị chip siêu cấp GB10 Grace Blackwell, có khả năng tính toán AI lên đến 1000 TOPS, khiến nó phù hợp cho “các nhà phát triển AI, chuyên gia nghiên cứu, nhà khoa học dữ liệu và sinh viên phát triển và tinh chỉnh các mô hình AI lớn trong môi trường ngoại tuyến”. Spark dự kiến có giá khoảng 3000 USD và sẽ mở đặt hàng trước vào hôm nay, giao hàng vào mùa hè. Hiện tại, Dell, Lenovo, HP và các hãng khác dự kiến cũng sẽ cho ra mắt các sản phẩm tương ứng với Spark.

DGX Spark

DGX Station mạnh mẽ hơn được trang bị GB300 Grace Blackwell Ultra, cung cấp 20.000 TOPS sức mạnh tính toán AI và RAM lên đến 784GB. Giá của trạm DGX vẫn chưa được công bố và dự kiến sẽ có mặt vào cuối năm nay.

Dynamo: Hệ thống công việc cốt lõi của nhà máy AI

Để tăng tốc độ suy luận quy mô lớn hơn nữa, Huang Renxun cũng đã phát hành một phần mềm mã nguồn mở NVIDIA Dynamo để tăng tốc và mở rộng các mô hình suy luận AI trong nhà máy AI.

Huang Renxun chỉ ra rằng, “Nó về bản chất là hệ điều hành của nhà máy AI.” Nó được đặt tên theo thiết bị đầu tiên khởi động cuộc cách mạng công nghiệp lần trước, ngụ ý rằng công nghệ này sẽ đóng vai trò then chốt trong một vòng cách mạng AI mới.

Thông qua Dynamo, có thể nâng cao hiệu suất của các mô hình suy diễn như DeepSeek lên 30 lần trong cùng một kiến trúc và với cùng một số lượng GPU.

Ra mắt mô hình robot đa năng mã nguồn mở đầu tiên trên toàn cầu có thể tùy chỉnh

Huang Renxun chỉ ra rằng sự thiếu hụt lao động là một vấn đề cấp bách mà toàn nhân loại phải đối mặt, robot chính là một giải pháp, ngành công nghiệp này có tiềm năng to lớn, hiện chúng ta đã bước vào thời đại AI đại diện, và trong tương lai sẽ tiến xa hơn đến AI vật lý.

Để đạt được điều này, NVIDIA đã ra mắt mô hình cơ bản chung GR00T N1 được thiết kế đặc biệt cho robot. Đây là mô hình cơ bản hoàn toàn có thể tùy chỉnh và mở đầu tiên trên thế giới cho suy luận hình người và kỹ năng.

NVIDIA cũng đang hợp tác với Google DeepMind và Disney để phát triển một nền tảng robot có tên là Newton. Huang Renxun đã đặc biệt mời một robot có tên là “Blue” lên sân khấu để trình diễn, nó là một trong những sản phẩm phát triển từ nền tảng Newton.

Robot được tạo ra bởi NVIDIA hợp tác với công ty nghiên cứu Disney và Google DeepMind cũng xuất hiện trên sân khấu.

Hợp tác với Universal để phát triển AI tự lái và nhà máy thông minh

Huang Renxun cũng đã công bố rằng General Motors sẽ mở rộng quan hệ đối tác với NVIDIA, sẽ thúc đẩy đổi mới thông qua việc tăng tốc tính toán và mô phỏng.

General Motors sẽ sử dụng nền tảng tính toán của Nvidia (bao gồm Omniverse và Cosmos) để xây dựng hệ thống trí tuệ nhân tạo (AI) tùy chỉnh, nhằm tối ưu hóa quy hoạch nhà máy và công nghệ robot của General Motors.

Ngoài ra, General Motors cũng sẽ sử dụng NVIDIA DRIVE AGX làm phần cứng trên xe để đạt được hệ thống hỗ trợ lái xe tiên tiến và trải nghiệm lái xe an toàn nâng cao trong xe. DRIVE AGX là một nền tảng mở có thể mở rộng, có thể hoạt động như bộ não AI của ô tô tự lái.

Sẽ hợp tác phát triển mạng 6G gốc AI

Huang Renxun cho biết, Nvidia sẽ hợp tác với T-Mobile, Mitre, Cisco, ODC và Booz Allen Hamilton để phát triển phần cứng, phần mềm và kiến trúc của mạng không dây 6G gốc AI.

Thêm chi tiết vui lòng nhấp để đọc “NVIDIA công bố lớn: Hợp tác cùng các ông lớn viễn thông phát triển công nghệ không dây AI 6G”

Thiết lập trung tâm nghiên cứu tính toán lượng tử

Ngoài những nội dung trên, NVIDIA cũng đã thông báo vào thứ Ba rằng họ sẽ thiết lập một trung tâm nghiên cứu tại Boston để cung cấp công nghệ tiên tiến cho việc thúc đẩy tính toán lượng tử.

Theo trang web chính thức của NVIDIA, Trung tâm Nghiên cứu Quantum Tăng tốc NVIDIA (gọi tắt là NVAQC) sẽ tích hợp phần cứng lượng tử hàng đầu với siêu máy tính trí tuệ nhân tạo, nhằm đạt được cái gọi là siêu tính toán lượng tử tăng tốc. NVAQC sẽ giúp giải quyết những vấn đề thách thức nhất trong tính toán lượng tử, từ tiếng ồn qubit cho đến việc chuyển đổi bộ xử lý lượng tử thực nghiệm thành thiết bị thực tiễn.

Các nhà đổi mới hàng đầu trong lĩnh vực điện toán lượng tử, bao gồm Quantum, Quantum Machines và QuEra Computing, sẽ sử dụng NVAQC để thúc đẩy tiến bộ thông qua hợp tác với các nhà nghiên cứu từ các trường đại học hàng đầu như Sáng kiến Khoa học và Kỹ thuật Lượng tử của Harvard (HQI) và Nhóm Hệ thống Lượng tử Kỹ thuật của Viện Công nghệ Massachusetts (MIT).

Huang Renxun cho biết: “Tính toán lượng tử sẽ tăng cường máy tính siêu tính toán trí tuệ nhân tạo để giải quyết một số vấn đề quan trọng nhất trên thế giới, từ phát hiện thuốc đến phát triển vật liệu.” “Hợp tác với cộng đồng nghiên cứu lượng tử rộng rãi hơn, thúc đẩy CUDA - tính toán lượng tử kết hợp, Trung tâm nghiên cứu lượng tử của Nvidia sẽ đạt được những bước đột phá trong việc tạo ra máy tính siêu tính toán lượng tử hữu ích quy mô lớn.”

Ra mắt mô hình nền tảng thế giới

NVIDIA cũng đã công bố vào thứ Ba rằng họ đã ra mắt mô hình nền tảng thế giới hoàn toàn mới NVIDIA Cosmos™ (WFMs), mang đến một mô hình suy luận mở và hoàn toàn có thể tùy chỉnh cho phát triển AI vật lý, đồng thời cung cấp cho các nhà phát triển sự kiểm soát chưa từng có về việc tạo ra thế giới.

NVIDIA cũng đã ra mắt hai bản kế hoạch mới, được hỗ trợ bởi NVIDIA Omniverse™ và nền tảng Cosmos, cung cấp cho các nhà phát triển một công cụ tạo dữ liệu tổng hợp quy mô lớn và có thể kiểm soát, dùng cho robot sau đào tạo và xe tự lái.

1X, Agility Robotics, Figure AI, Foretellix, skillai và các nhà lãnh đạo trong ngành như Uber đã tiên phong áp dụng Cosmos để tạo ra dữ liệu huấn luyện phong phú hơn cho AI vật lý một cách nhanh chóng và quy mô lớn hơn.

Huang Renxun cho biết: “Cũng giống như các mô hình ngôn ngữ lớn đã hoàn toàn thay đổi trí tuệ nhân tạo sinh và đại lý, mô hình cơ sở vũ trụ là một bước đột phá trong trí tuệ nhân tạo vật lý… Cosmos đã giới thiệu một mô hình suy luận mở, hoàn toàn có thể tùy chỉnh cho trí tuệ nhân tạo vật lý và tạo ra cơ hội cho sự tiến bộ hàm nhảy trong ngành robot và vật lý.”

Xem bản gốc

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bình luận

0/400

Không có bình luận