Khi Token trở thành lực lượng lao động, con người trở thành giao diện

TOKEN1,89%

Tác giả: Lin Wanwan

Năm 1876, Triển lãm thế giới Philadelphia. Hoàng đế Brazil Pedro II cầm chiếc điện thoại do Bell phát minh, nghe thấy tiếng nói ở đầu kia, kinh ngạc thốt lên: "Chúa ơi, nó có thể nói chuyện rồi!"

Một trăm năm rưỡi sau, ngày 18 tháng 3 năm 2026, Trung tâm hội nghị San Jose. Ngồi trong áo khoác da đen, Jensen Huang đứng trên sân khấu của hội nghị GTC, cũng nói một câu khiến người ta phải kinh ngạc.

"Trong mười năm nữa, NVIDIA có thể có khoảng 75.000 nhân viên. Họ sẽ cực kỳ bận rộn, vì phải làm việc cùng 7,5 triệu AI agent."

Khán giả dưới khán đài cười.

75.000 người, 7,5 triệu agent, tỷ lệ 1:100.

Jensen Huang cũng cười, bổ sung: "Chúng sẽ làm việc suốt ngày đêm. Hy vọng nhân viên của chúng ta không phải so sánh với chúng."

Tiếng vỗ tay tản đi, con số này bị những buổi ra mắt chip và thỏa thuận hợp tác sặc sỡ hơn trong ngày lấn át. Nhưng nếu ta tách riêng nó ra suy nghĩ một chút, có thể đây là một trong những câu nói quan trọng nhất của toàn bộ hội nghị.

Không chỉ có Jensen Huang. Ba tháng trước, một người khác đã mô tả rõ hơn về cùng một tương lai đó.

Tháng 1 năm 2026, tại CES Las Vegas. CEO của McKinsey, Bob Sternfels, ngồi trên sân khấu báo cáo số liệu.

"Hiện tại chúng tôi có 40.000 nhân viên con người, khoảng 25.000 AI agent." Chưa đầy hai năm trước, con số này chỉ vài nghìn. Trong nửa năm qua, 25.000 agent đó đã tạo ra 2,5 triệu biểu đồ.

2,5 triệu biểu đồ. Trước đây, công việc này do các analyst mới vào nghề làm. 23-24 tuổi, mang danh hiệu trường đại học danh tiếng thế giới, thức khuya đến 3 giờ sáng để căn chỉnh trục tọa độ.

Đó là bước khởi đầu của mỗi analyst mới tại McKinsey, đổi lấy một tấm vé dẫn đến con đường trở thành partner qua công việc cực nhọc.

Giờ đây, nửa đầu của tấm vé đó đã bị các agent tiếp quản. Sternfels nói: "AI đã làm tăng 25% các vị trí công việc nhất định, đồng thời cũng làm giảm 25% các vị trí khác." Công ty bị chia thành hai phần rõ rệt, một bên mở rộng, một bên co lại.

Câu chuyện của NVIDIA và McKinsey kể về cùng một điều.

Trong thế giới tỷ lệ 1:100, công việc do các agent điều khiển bằng Token, còn con người chỉ là giao diện kết nối với các agent đó.

Remote điều khiển không nằm trong tay bạn

Trong tuần GTC đó, Jensen Huang xuất hiện trên podcast All-In, nói một câu còn mạnh mẽ hơn.

"Giả sử bạn có một kỹ sư lương 50 nghìn USD một năm. Nếu anh ta không tiêu ít nhất 25 nghìn USD Token, tôi sẽ rất lo lắng."

Người dẫn hỏi: "NVIDIA có đang chi 2 tỷ USD để mua Token cho đội ngũ kỹ thuật không?" Jensen trả lời: "Chúng tôi đang cố gắng."

Một kỹ sư không tiêu Token, dù lương 50 nghìn USD cũng chẳng đáng giá 50 nghìn USD.

Giải pháp của NVIDIA rất đơn giản, là đưa Token vào trong gói lương thưởng. Trong bài phát biểu chính tại GTC, Jensen nói rằng trong tương lai, mỗi kỹ sư của NVIDIA sẽ có một ngân sách Token hàng năm, khoảng bằng một nửa lương cơ bản.

Một kỹ sư có mức lương vài chục nghìn USD, sẽ được cấp thêm một phần tính toán suy luận tương đương nửa lương, trong tổng gói thưởng, một phần ba là nhiên liệu thuần túy.

Người nhận đủ ngân sách Token đầy đủ, tương đương có hơn chục AI agent làm việc suốt ngày giúp viết code, chạy thử nghiệm, tìm tài liệu, thực hiện mô phỏng. Người chỉ có API miễn phí thì vẫn phải tự mình gõ bàn phím. Hai người có thể có hồ sơ giống hệt nhau, nhưng sản lượng có thể chênh lệch từ 5 đến 10 lần.

Điều này ở Silicon Valley đã không còn là lý thuyết nữa.

Tháng 3 năm nay, Business Insider đưa tin về một sự thay đổi: trong phỏng vấn tuyển dụng kỹ sư, người ta bắt đầu hỏi "Vị trí này cấp bao nhiêu ngân sách Token?" Partner của Theory Ventures, Tomasz Tunguz, gọi ngân sách Token là "trụ cột thứ tư" của lương kỹ sư, sau lương cơ bản, thưởng và cổ phần.

Chủ tịch của OpenAI, Greg Brockman, còn thẳng thắn hơn: "Bạn có thể gọi là bao nhiêu suy luận tính toán, sẽ ngày càng quyết định năng suất tổng thể của bạn."

Jensen Huang cũng nói trong bài phát biểu của mình: "Có bao nhiêu Token theo vị trí của tôi? Điều này đã trở thành công cụ tuyển dụng của Silicon Valley rồi."

Thời kỳ năm 1950, công nhân ô tô ở Detroit đứng đầu toàn nước Mỹ về mức lương. Điều thực sự giúp họ sống trung lưu là dây chuyền sản xuất do Henry Ford phát minh. Công nhân đứng trên dây chuyền, máy móc hoạt động, còn họ đứng yên, sản lượng của mỗi người được nâng cao gấp hàng chục lần nhờ cánh tay robot. Mức sống của công nhân Detroit cao hơn nhiều so với các thợ thủ công cùng thời, tay nghề chưa chắc đã tốt hơn, nhưng họ đi trên một dây chuyền sản xuất dày đặc hơn.

Ngân sách Token năm 2026 chính là dây chuyền sản xuất của năm 1950.

Nhưng có một điểm khác biệt.

Công nhân Detroit rời Ford, có thể đi làm ở General Motors, Chrysler, đâu đâu cũng có dây chuyền. Công đoàn có thể thương lượng với chủ, đòi hỏi tốc độ dây chuyền tốt hơn, môi trường làm việc an toàn hơn.

Ngược lại, ngân sách Token khác. Công ty cấp cho bạn ngày hôm đó, bạn là siêu nhân, ngày hôm sau bạn trở lại là người bình thường. Cổ phiếu có thể bán ra lấy tiền, kỹ năng có thể theo bạn chuyển việc. Ngân sách Token chẳng là gì cả, chỉ là phần mở rộng, công ty kiểm soát hoàn toàn.

Trong giới công nghệ Silicon Valley, đã có từ mới để mô tả tình cảnh này, gọi là "GPU đói khát".

Các nhà nghiên cứu AI hàng đầu chuyển việc, chênh lệch lương đã xếp thứ hai, sau đó là khả năng tính toán. Không thể chạy thử nghiệm, không thể triển khai agent, năng lực bị giới hạn bởi hạn mức. "Bạn cấp bao nhiêu Token" đôi khi còn quan trọng hơn cổ phiếu. Cổ phiếu là một tấm séc kỳ hạn có thể giảm giá, còn Token là năng suất có thể thực hiện ngay hôm nay.

Và những người không dùng AI, sẽ bị loại bỏ trực tiếp.

Goldman Sachs ước tính AI có thể tự động hóa 25% công việc tại Mỹ. Mercer khảo sát cho biết 65% các lãnh đạo cấp cao dự đoán 20-30% nhân viên sẽ được tái phân bổ do AI. Hai con số này cộng lại rõ ràng: người có Token sản xuất bùng nổ, người không có Token sẽ bị tối ưu hóa.

Ranh giới phân chia là hạn mức Token, và khả năng của con người, ngày càng ít liên quan.

Thông lượng Token chính là định giá trị

Giá trị cá nhân được quyết định bởi hạn mức Token. Còn công ty thì sao?

Tháng 3 đầu năm 2026, một công ty tên MiniMax ở Thượng Hải công bố báo cáo tài chính lần đầu kể từ khi niêm yết. Doanh thu cả năm đạt 79 triệu USD, lỗ ròng điều chỉnh là 250 triệu USD. Theo các chỉ số tài chính truyền thống, đây là một công ty nhỏ tiêu tiền, doanh thu chỉ bằng một phần nhỏ của một quý của Accenture.

Nhưng thị trường vốn không nhìn nhận như vậy.

CEO của MiniMax, Yan Junjie, trong cuộc họp báo cáo tài chính đã nói một câu còn quan trọng hơn cả toàn bộ báo cáo: "Giá trị của công ty được quyết định bởi mật độ trí tuệ nhân tạo nhân với thông lượng Token."

Thông lượng Token không phải tốc độ tăng trưởng doanh thu, không phải số lượng người dùng, không phải tỷ lệ lợi nhuận gộp.

Dữ liệu hỗ trợ câu nói này rất chắc chắn. Tháng 2 năm 2026, trung bình mỗi ngày, mô hình dòng M2 của MiniMax tiêu thụ Token gấp 6 lần so với tháng 12 trước đó. Trong các kịch bản lập trình, tiêu thụ Token tăng gấp 10 lần. Trên nền tảng tổng hợp mô hình AI OpenRouter, trong hai tuần, MiniMax đã tiêu thụ 4,55 nghìn tỷ Token, vượt qua tất cả các mô hình của Mỹ, lần đầu tiên đứng đầu bảng xếp hạng toàn cầu về tiêu thụ Token.

Báo South China Morning Post đưa tin về sự kiện này với cách nói: "Mô hình mã nguồn mở của Trung Quốc đã chấm dứt sự thống trị của các nhà phát triển Mỹ kéo dài một năm trên thị trường. Điều quyết định là gì? Chính là lượng tiêu thụ Token. Ai tiêu thụ nhiều Token nhất, người đó là người chiến thắng."

Logic này cũng đúng với OpenAI. Nền tảng API của OpenAI xử lý 6 tỷ Token mỗi phút, tăng gấp 20 lần trong hai năm. Các khách hàng doanh nghiệp tiêu dùng hơn 100.000 USD mỗi năm đã tăng gần 7 lần trong một năm. Nhà phân tích của Barclays, Ross Sandler, sau khi phân tích dữ liệu, kết luận: "Lượng tiêu thụ Token của OpenAI trên nền tảng tiêu dùng vượt hơn gấp đôi Google Gemini."

Lượng tiêu thụ Token đã trở thành đồng tiền cứng để xếp hạng các công ty AI.

Điều thú vị hơn nữa là hình ảnh này trong nội bộ các công ty. Gần đây, tờ New York Times đưa tin về hiện tượng gọi là "tokenmaxxing": các kỹ sư của Meta và OpenAI thi đua trong bảng xếp hạng nội bộ xem ai tiêu thụ nhiều Token hơn.

Ngân sách Token đang trở thành phần thưởng tiêu chuẩn, giống như bữa trưa miễn phí và bảo hiểm nha khoa cách đây mười năm. Một kỹ sư làm việc tại văn phòng Ericsson ở Stockholm nói với NYT rằng, số tiền anh ta chi cho Claude có thể còn cao hơn lương của anh, nhưng công ty trả.

Bài viết của TechCrunch tuần trước tính toán: một kỹ sư viết bài vào buổi chiều có thể tiêu tốn 10.000 Token, còn một kỹ sư vận hành nhóm agent, trong một ngày có thể tiêu tốn hàng triệu Token mà không cần gõ một chữ nào.

Hai năm trước, giá của mỗi triệu Token là 33 USD. Bây giờ chỉ còn 9 cent. Giảm 99,7%. Giá rẻ hơn, tiêu thụ nhiều hơn. Tiêu thụ nhiều hơn, càng không thể rời xa.

Yan Junjie dự đoán trong cuộc họp: "Trong tương lai, nhu cầu Token có thể tăng thêm một hoặc hai cấp số nhân."

Đây chính là cách định giá mới cho một công ty vào năm 2026. Không còn quan tâm bạn kiếm được bao nhiêu tiền, mà là bạn đã tiêu thụ bao nhiêu Token. MiniMax lỗ 250 triệu USD, nhưng đường cong tăng trưởng thông lượng Token cực kỳ dốc, thị trường sẵn sàng đặt cược. Bạn có thể so sánh nó với YouTube năm 2006, chưa kiếm nổi đồng nào, nhưng băng thông tiêu thụ tăng theo cấp số nhân, Google sẵn sàng bỏ ra 1,65 tỷ USD để mua lại.

Năm đó, YouTube tiêu tốn băng thông. Hôm nay, MiniMax tiêu thụ Token. Đơn vị đo lường đã thay đổi, nhưng logic vẫn vậy.

Sản lượng có thể đáp ứng, nợ thì không thể vay

Trong tuần GTC đó, còn xảy ra một sự kiện khác.

Ngày 18 tháng 3, Stripe công bố "Machine Payments Protocol". Nói rõ hơn: AI agent giờ có thể tự chi tiền.

Một agent cần một bộ dữ liệu, tự trả phí để tải xuống. Cần tính toán để chạy suy luận, tự mua theo giây. Cần gọi API của agent khác, tự thanh toán. Toàn bộ quá trình không cần con người xác nhận. Visa đã tích hợp thanh toán qua thẻ tín dụng cho giao thức này, Coinbase đã tạo ví riêng cho agent, Mastercard đang phát triển "Agent Pay".

Lượng tiêu thụ Token từ đó có thêm một nguồn mới. Trước đây chỉ có "người điều phối agent". Giờ đây, chính các agent cũng tiêu thụ Token, và dùng tiền kiếm được để mua thêm Token. Đồng sáng lập Stripe, John Collison, gọi đó là "dòng chảy lớn".

Jensen Huang đưa ra con số tương ứng: NVIDIA muốn tăng tốc độ tạo Token từ 22 triệu lên 700 triệu, gấp 350 lần.

Đây là xây dựng một mạng lưới đường cao tốc, cược rằng lưu lượng xe sẽ tăng theo cấp số nhân.

Đầu tư hạ tầng trị giá 600 tỷ USD, cần một giả thiết: toàn thế giới tiêu thụ Token đủ lớn để bù đắp chi phí. Giả thiết này hiện vẫn chỉ là giả định, và là một giả định rất đắt đỏ.

Cuối quý IV năm 2025, các công ty công nghệ phát hành kỷ lục 108,7 tỷ USD trái phiếu. Đầu năm 2026, trong vài tuần đầu, lại phát hành 100 tỷ USD nữa.

Morgan Stanley và JPMorgan dự đoán tổng số nợ của các doanh nghiệp liên quan đến AI trong vài năm tới có thể lên tới 1,5 nghìn tỷ USD. Goldman Sachs ước tính, chi tiêu vốn cho AI đã chiếm khoảng 3% GDP Mỹ.

Những người đầu tiên trong phố Wall đã bắt đầu mua bảo hiểm rủi ro. Giao dịch swap vỡ nợ ngày càng tăng. Với phí bảo hiểm vài chục điểm phần trăm, họ cược rằng các công ty này có thể không trả nổi nợ. Giám đốc chiến lược tín dụng của Citi, Daniel Sorid, nói trong một cuộc họp nhà đầu tư: "Là nhà đầu tư tín dụng, đối mặt với cuộc chuyển đổi quy mô này, cần một lượng vốn lớn như vậy, khiến người ta cảm thấy bồn chồn."

Larry Page, sáng lập Google, từng nói trong nội bộ công ty một câu còn cực đoan hơn: "Tôi thà phá sản còn hơn thua trong cuộc đua này."

Điều đó mô tả chính xác một tình thế bẫy của kẻ bị giam giữ: các ông lớn đều cược đối thủ sẽ tiếp tục đầu tư, nên không thể dừng lại. Người dừng lại sẽ bị loại khỏi cuộc chơi.

Phía lạc quan có dữ liệu thực tế. Tốc độ tạo Token tăng gấp 350 lần. Stripe vừa cho phép agent tự chi tiền. McKinsey trong hai năm đã mở rộng từ vài nghìn agent lên 25.000. Nếu mô hình agent phát triển toàn diện, đường cong tiêu thụ Token thực sự có thể biến thành cấp số nhân.

Nhưng có một ngày khiến nhiều người không ngủ được. Cuối năm 2026, điểm sập hợp đồng gia hạn.

Từ năm 2024 đến 2025, các doanh nghiệp chi "ngân sách đổi mới". CEO cần nói trong báo cáo tài chính: "Chúng tôi đang đón nhận AI", giá cả không quá nhạy cảm, hiệu quả không quá khắt khe, đó là tiền cho hình thức. Đến cuối năm 2026, các dự án thử nghiệm đầu tiên đến điểm gia hạn. Ngân sách đổi mới cạn kiệt, CTO nhường chỗ cho CFO. CFO chỉ quan tâm một con số: ROI.

Nếu nhiều dự án thử nghiệm bị cắt bỏ, tiêu thụ Token cuối cùng sẽ đột ngột thiếu hụt. Công suất đã đầu tư 600 tỷ USD từ nguồn trên, trung tâm dữ liệu đã xây xong, điện đã kết nối, chip đã lắp đặt, trở thành công suất dư thừa.

Điều này đã từng xảy ra trong lịch sử.

Năm 2000, các công ty viễn thông chi trăm tỷ USD để lắp đặt cáp quang dưới đáy biển. Bong bóng vỡ, 90% cáp quang toàn cầu bị chôn vùi dưới đáy biển, bỏ không gần chục năm. Đến khi Netflix bắt đầu phát trực tuyến, iPhone bùng nổ internet di động, các cáp quang mới lần lượt được khai sáng. Cáp quang không phí công lắp đặt vô ích. Các công ty như Lucent, Nortel, WorldCom đều phá sản. Hạ tầng vẫn còn đó, nhưng nhà xây dựng đã biến mất.

Năm 2012, ngành năng lượng mặt trời Trung Quốc. Wuxi Suntech, Jiangxi Sàiwéi đẩy giá tấm pin xuống dưới mức chi phí toàn cầu. Công suất dư thừa nặng nề, ngành này trải qua ba năm máu lửa. Sau đó, nhu cầu thực sự đến, năng lượng mặt trời ngày nay là nguồn năng lượng phát triển nhanh nhất trên trái đất. Suntech phá sản. Sàiwéi phá sản. Những người đi trước nằm trong bóng tối cuối cùng của bình minh.

Sau khi Bell phát minh ra điện thoại, Western Union từ chối mua bằng sáng chế với giá 100.000 USD. Mười năm sau, Western Union sẵn sàng trả 25 triệu USD, Bell không bán nữa. Ba mươi năm sau, mạng điện thoại phủ khắp toàn nước Mỹ. Nhưng các công ty nhỏ lắp đặt mạng đó hầu như không còn tồn tại đến ngày điện thoại phổ biến. Người chiến thắng là AT&T, sau này mua lại và độc quyền tất cả.

Câu chuyện về hạ tầng luôn luôn theo kiểu này. Hướng đi gần như luôn đúng, nhưng chênh lệch thời gian có thể giết chết tất cả.

Quay lại với Token. Cấu trúc đã đề cập trước đó, Token trở thành lao động, con người trở thành giao diện, hạn mức Token quyết định tất cả, và điều kiện để thành lập là Token phải liên tục, lớn mạnh và tăng tốc tiêu thụ. Sản lượng gấp 10 lần của kỹ sư dựa vào cung cấp Token, nếu cắt đi, sẽ về 0. Định giá trị của OpenAI, dựa trên cam kết về sức mạnh tính toán, là dựa trên đó, nếu hợp đồng chấm dứt, giá trị sẽ giảm sút. Cơ sở hạ tầng trị giá 600 tỷ USD dựa vào tốc độ tiêu thụ cuối cùng, nếu tốc độ này chậm lại, sẽ trở thành dư thừa.

Mỗi tầng đều phụ thuộc vào tầng dưới. Tốc độ tiêu thụ chậm hơn tốc độ xây dựng từ hai đến ba năm, toàn bộ chuỗi giá trị sẽ bắt đầu lung lay.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận