Chuyên gia trong ngành tụ họp, Suy nghĩ và đột phá trong kỷ nguyên AI Agent

null

Ngày nay, kinh tế của Agent đã không còn là khái niệm khoa học viễn tưởng nữa; thay vào đó, nó không chỉ tạo ra bước nhảy vọt về hiệu suất, mà còn là sự tái cấu trúc và phân bổ lại cách thức tổ chức kinh tế. Đặc biệt, dự án mã nguồn mở OpenClaw bỗng bùng nổ trên toàn cầu đã tiếp tục thúc đẩy các mô hình lớn từ phòng thí nghiệm tiến vào ứng dụng quy mô lớn; các bên thi nhau tham gia “cuộc chiến giành lối vào” cho Agent.

Vậy rốt cuộc mô hình lớn nên chọn nhà nào? Nguồn tài nguyên Token có đủ để hỗ trợ sử dụng lâu dài không? Không chạy theo trào lưu OpenClaw (tôm hùm) thì sẽ bị thời đại đào thải ư? Trong cuộc cách mạng AI đang tăng tốc này, cá nhân nên xử lý và đột phá như thế nào?

Mang theo những câu hỏi đó, ngày 3 tháng 4, Trung tâm đổi mới sáng tạo Từ Gia Hối Thượng Hải, Hiệp hội công nghệ đồng thuận phân tán Thượng Hải, PANews và Công ty luật Mankun đã cùng phối hợp tổ chức sự kiện theo chủ đề “Đừng ‘lo sốt vó’ về ‘tôm hùm’”.

Trong phần diễn thuyết chủ đề “Ôm lấy làn sóng AI không thể đoán trước”, Kiến trúc sư trưởng của Conflux Tree, Lý Thần Tinh, cho biết hiện nay, việc trao nhiều quyền chủ động hơn cho AI, thay vì ràng buộc quá mức bằng kinh nghiệm hữu hạn của con người, là xu hướng tất yếu của giai đoạn phát triển công nghệ hiện tại. Vấn đề “thiếu cân nhắc” mà AI thể hiện hiện nay, xét về bản chất, nằm ở chỗ trong các bối cảnh phức tạp, AI khó có thể nắm bắt ổn định và ghi nhớ liên tục những ràng buộc ngữ cảnh quan trọng. Xét từ góc độ cấu trúc kỹ thuật, AI chủ yếu dựa vào trí nhớ theo tham số, trí nhớ theo ngữ cảnh và trí nhớ bên ngoài; tuy nhiên, các cơ chế này vẫn tồn tại các vấn đề như khó cập nhật, giới hạn cửa sổ và hiệu suất gọi lệnh chưa đủ. Vì vậy, trong tương lai cần tập trung tăng cường năng lực gọi trí nhớ bên ngoài, nghiên cứu cơ chế học tập liên tục và tái sử dụng kinh nghiệm, đồng thời thông qua thực hành theo lĩnh vực dọc để dần tích lũy trí nhớ kiểu kinh nghiệm, nhằm nâng cao tính toàn vẹn và độ tin cậy trong quyết định của AI ở các bối cảnh phức tạp thực tế.

Ông cũng chỉ ra rằng, tiến bộ cốt lõi của AI hiện nay chủ yếu thể hiện ở việc tăng cường năng lực tự phân tích và tự phản tư; trong tương lai, khi năng lực ghi nhớ được cải thiện, có thể vượt qua các nút thắt then chốt và tạo ảnh hưởng sâu rộng tới nhiều ngành. Ví dụ, hiện tại tiềm năng của danh tính số và hệ thống thanh toán số đang bị kìm hãm lâu dài bởi ngưỡng phát triển và ngưỡng người dùng; nhưng AI có thể giải phóng giá trị đó bằng cách giảm chi phí phát triển và thay thế quá trình học của người dùng bằng phương thức dạng đại lý (agent). Nhìn chung, AI không nên được xem là mối đe dọa việc làm, mà là công cụ then chốt để nâng cao năng suất lao động và tạo ra cơ hội mới; cá nhân và ngành cần giữ tâm thế cởi mở, chủ động khám phá các lối đi tích hợp AI.

Theo Kiến trúc sư sản phẩm Workbuddy của Tencent Cloud, Phùng Hà Thanh, cho biết khi năng lực của các mô hình lớn tăng lên rõ rệt, AI đã chuyển từ giai đoạn đầu chỉ hỗ trợ các tác vụ phụ trợ phát triển như gợi ý hoàn thiện mã sang khả năng có thể tự hoàn thành các nhiệm vụ phức tạp; trong đó, năng lực cốt lõi của Agent tùy chỉnh thể hiện ở hỗ trợ tác vụ theo toàn bộ quy trình, phối hợp đa vai, hệ thống trí nhớ phân tầng và tách tác vụ thông minh dựa trên ngữ cảnh. Đồng thời, nhờ phối hợp nhiều Agent, có thể thực hiện luân chuyển dữ liệu giữa các tác vụ và xử lý song song; ở lớp bảo mật, sử dụng cơ chế lưu trữ dữ liệu cục bộ và xác nhận thủ công các thao tác then chốt để đảm bảo an toàn dữ liệu. Ở lớp ứng dụng, WorkBuddy đã bao phủ các tình huống văn phòng điển hình như lọc CV, tự động tạo PPT, phân tích dữ liệu và tích hợp báo cáo tuần; đồng thời có thể thông qua năng lực tích hợp cấp doanh nghiệp để kết nối với các hệ thống như Qiye Weixin, thực hiện quản lý tác vụ thống nhất. Kiến trúc kỹ thuật của giải pháp nhấn mạnh phát triển toàn stack, cách ly môi trường thực thi và kiểm soát quyền cấp doanh nghiệp; hỗ trợ triển khai cả tại chỗ và trên đám mây. Về mô hình kinh doanh, có thể nhắm tới người dùng như bộ phận R&D doanh nghiệp và các vị trí công việc văn phòng số hóa tần suất cao. Nhìn chung, WorkBuddy hướng tới việc nâng cao hiệu suất sản xuất của doanh nghiệp thông qua năng lực Agent tùy chỉnh và phối hợp đa tác vụ, đồng thời thông qua liên tục tối ưu khả năng tách tác vụ và mở rộng hệ sinh thái, tăng cường hơn nữa tính phù hợp và khả năng triển khai trong các bối cảnh doanh nghiệp phức tạp.

Sáng lập viên Biteye và XHunt, Teddy, chủ yếu tập trung chia sẻ về thực tiễn “nhân viên số”, ứng dụng mô hình lớn và vấn đề chi phí, rủi ro cấu hình kỹ thuật và bảo mật, cũng như tối ưu cách thức phối hợp. Trong mảng thực tiễn nhân viên số, để giảm ảo tưởng của mô hình (hallucination) và tỷ lệ viết mã sai, cần đưa vào Agent dạng kiểm tra cấp cao hơn để rà soát lần hai mã do các Agent cấp thấp tạo ra, hình thành quy trình đánh giá mã bắt buộc. Do hiện tại việc viết mã của Agent vẫn còn tồn tại một số bug, có thể giảm lỗi bằng cách chuẩn hóa quy trình phát triển, tăng cường thiết kế từ nhắc (prompt) và bổ sung cơ chế kiểm tra đa vòng. Đồng thời, trong các kịch bản thuộc nhóm vận hành (operational), cần đặc biệt kiểm soát tần suất đăng bài, và cố gắng thông qua API phía sau để điều độ thống nhất nhằm đảm bảo tính ổn định. Trong môi trường phối hợp nhóm phức tạp, Discord thường phù hợp hơn Telegram cho việc phối hợp Agent và phân phát tác vụ; về quản lý tài nguyên, cần đặc biệt chú ý mức tiêu hao Token. Ngoài ra, hệ thống Agent vẫn cần con người đầu tư thời gian để huấn luyện, tinh chỉnh và hiệu chỉnh hành vi.

Về cài đặt và triển khai OpenClaw, Teddy gợi ý có thể chọn chạy trên máy tính để bàn nhàn rỗi hoặc Mac Mini, có quyền kiểm soát độc lập tương đối cao, mã nguồn tổng thể là mã nguồn mở, nhấn mạnh khả năng bảo vệ quyền riêng tư và có thể kết nối với hệ sinh thái quốc tế; tuy nhiên, ngưỡng cài đặt và cấu hình tương đối cao. Trong quá trình sử dụng cần đặc biệt chú ý rủi ro khi sửa đổi cấu hình của mô hình và kênh, tránh hệ thống bị bất thường do cấu hình không đúng; khi gặp vấn đề, có thể nhờ các công cụ như Grok và Gemini để hỗ trợ truy tìm. Đồng thời, ở lớp bảo mật cần phòng ngừa các rủi ro như tấn công qua prompt và tiêm skill độc hại. Ở phương diện tài nguyên và chi phí, cũng cần quan tâm kiểm soát tiêu hao Token để tránh chi phí vận hành quá cao.

Luật sư đối tác của Công ty luật Mankun, Triệu Huyên, trong bài diễn thuyết chủ đề đã chia sẻ ba vấn đề pháp lý lớn mà người khởi nghiệp thời AI cần quan tâm và các giải pháp. Thứ nhất là “vỏ bọc tổ chức”, tức “sự cách ly giả” mà công ty một người (OPC) tạo ra: bề ngoài hình thành pháp nhân độc lập, nhưng thực tế khó có thể tách biệt thực sự trách nhiệm và rủi ro; cần thiết lập sự cách ly thực sự về mặt vật lý và pháp lý, bao gồm về kiến trúc đưa đối tác vào, sử dụng thẻ tín dụng công vụ riêng và chèn vào hợp đồng tuyên bố miễn trừ trách nhiệm về AI cùng giới hạn bồi thường; thứ hai là vấn đề quyền sở hữu đối với tài sản cốt lõi, nỗ lực không đồng nghĩa với quyền lực, cần chứng minh quyền thống trị của chính mình, ghi chép đầy đủ quá trình sáng tạo và lưu chứng cứ; thứ ba là rủi ro mang tính hệ thống do “bá quyền nền tảng” tạo ra, bao gồm rủi ro “rút dây” như các điều khoản của thượng đế (upper帝條款), khóa kỹ thuật, v.v.; tách dữ liệu cốt lõi khỏi dịch vụ bên thứ ba, lên kế hoạch trước cho phương án thay thế, và đưa vào công nghệ phi tập trung.

Trong phiên thảo luận tròn “Từ cuồng nhiệt đến tỉnh táo, nhu cầu AI thật sự và các giả thuyết ngụy biện trong con mắt của VC”, nhiều nhà đầu tư đã chia sẻ về giai đoạn phát triển của AI, ranh giới ứng dụng và logic đầu tư, v.v.

Người sáng lập và đối tác của Waterdrop Capital, Cự Giải, cho rằng AI vẫn đang ở giai đoạn phát triển sớm; để thực sự đạt tới mức độ trưởng thành về trải nghiệm người dùng và được đông đảo cho là “có ý nghĩa”, vẫn cần thời gian dài hơn. Ông cho biết tốc độ lặp lại (iteration) của công nghệ AI cực nhanh; chỉ dựa vào việc dẫn đầu công nghệ khó hình thành “hào” bảo vệ bền vững trong dài hạn, vì vậy đầu tư nên tập trung hơn vào các năng lực nền tảng có tính không thể thay thế, ví dụ như tài nguyên cốt lõi như sức mạnh tính toán. Ở lớp ứng dụng, ông lấy ví dụ rằng các công cụ như “tôm hùm” không thân thiện với người dùng lập trình phổ thông; nhưng trong tương lai, có thể phù hợp hơn khi được đóng gói thành các ứng dụng theo bối cảnh dọc như “bác sĩ gia đình”, cung cấp lời khuyên chuyên môn thông qua dữ liệu sức khỏe theo thời gian thực. Đồng thời, ông cho rằng ở phía doanh nghiệp, AI có thể thay thế các công cụ sản xuất thông tin như báo cáo phân tích, nhưng không thể thay thế vai trò quyết định cuối cùng; AI chỉ có thể tồn tại như công cụ hỗ trợ ra quyết định.

Người sáng lập của Enlight Capital, Tang Yi, cho biết hiện tại trong lĩnh vực đầu tư AI khá khó hình thành cơ hội rõ ràng “phi đồng thuận” (non-consensus); việc các mô hình lớn lặp lại nhanh có thể kéo dài việc “san phẳng” lợi thế của các công ty ở lớp ứng dụng. Ông tương đối lạc quan về hướng kết hợp Web3 và AI, cho rằng mỗi bên lần lượt đại diện cho năng lực sản xuất tiên tiến của lĩnh vực tương ứng. Đối với các công cụ mã nguồn mở như OpenClaw, ông cho rằng chúng tương đương như việc “trao tay và chân” cho mô hình lớn, tăng cường khả năng liên kết với hệ thống bên ngoài và ứng dụng xã hội; nhưng đồng thời cũng tạo ra rủi ro bảo mật và dữ liệu cao hơn, vì vậy cần cấu hình phức tạp và không phù hợp với người dùng phổ thông. Hiện tại, lộ trình lý tưởng hơn là nâng cao tính dễ dùng và trải nghiệm tổng thể thông qua việc đóng gói.

Nhà đầu tư của First Rule Ventures, Yinghao, tiếp cận từ góc độ người dùng và sản phẩm, tập trung vào cơ hội ứng dụng trong các ngành thuộc “vùng nước sâu”, sáng tạo AI, và các hướng kết hợp phần mềm/phần cứng; đồng thời đánh giá tiềm năng dự án thông qua hành vi người dùng và dữ liệu tương tác. Ông cho biết ngay cả khi không tự mình thử tất cả các sản phẩm AI mới nổi, thì cũng không có nghĩa là sẽ bỏ lỡ xu hướng quan trọng, vì năng lực công nghệ thường được mô-đun hóa nhanh và tích hợp vào hệ thống sản phẩm hiện có.

So với một sản phẩm đơn lẻ, ông quan tâm hơn đến ba thay đổi cấu trúc dài hạn: một là liệu tương tác AI có đang hình thành một “chất mang trí nhớ” mới hay không, để nhận thức và công việc của người dùng được lắng đọng trong một hệ thống nào đó; hai là liệu trí nhớ này có khả năng chuyển dịch qua nhiều sản phẩm hay không, hay dần bị ràng buộc trong một sản phẩm duy nhất, từ đó tạo ra chi phí chuyển đổi cao và khóa trải nghiệm; ba là liệu có xuất hiện một “siêu lối vào” mới hay không, trở thành trung tâm cốt lõi của tương tác AI và phân phối lưu lượng.

Luật sư đối tác của Công ty luật Mankun, Triệu Huyên, trong việc sử dụng sản phẩm AI, chủ yếu dùng công cụ cho xử lý dữ liệu, truy xuất (retrieval) và phân tích, đồng thời kỳ vọng trong tương lai sẽ có nhiều sản phẩm tích hợp hơn để gom các năng lực này vào một. Ông cũng nhấn mạnh rằng trong khởi nghiệp AI, điều quan trọng hơn là tránh thất bại thảm trọng một lần; ông đề xuất doanh nghiệp ngay từ giai đoạn đầu cần coi trọng các thiết kế pháp lý then chốt như tuân thủ dữ liệu, điều khoản trọng tài và điều khoản miễn trừ trách nhiệm, để khi xuất hiện rủi ro không thể kiểm soát, có thể thực hiện tách biệt rủi ro và bảo vệ trách nhiệm ở mức tối đa, qua đó tránh để rủi ro điểm đơn khiến công ty sụp đổ toàn diện. Ngoài ra, ông cũng kỳ vọng rằng trong tương lai, Agent sẽ trở thành chủ thể thực thi kinh tế chính, chịu trách nhiệm thu thập dữ liệu, mua thông tin, thực thi chiến lược, thậm chí giao dịch xuyên hệ thống, từ đó hình thành các hoạt động kinh tế và hệ thống thanh toán giữa máy với máy.

Trong cuộc thảo luận tròn chủ đề “7 cách mở AI khác nhau, nói về cơ hội của người đổi mới”, nhiều khách mời từ góc nhìn khác nhau đã thảo luận về những thay đổi mà AI đang mang lại. CEO của Matrix Intelligence, Zeno, đề xuất rằng người dùng có thể thông qua tự thay đổi script hoặc plugin của mình để kết nối nhiều thiết bị, từ đó đạt đồng bộ bộ nhớ và nhất quán trạng thái giữa nhiều bên; làm sao cho thông tin không bị mất và tác vụ không bị gián đoạn. Đồng thời, người dùng cũng có thể thêm cơ chế thanh lọc/tổng kết lại hằng ngày để duy trì sự ổn định của hệ thống. So với việc sử dụng các công cụ có sẵn, việc người dùng dựa trên quyền hạn cấp doanh nghiệp hoặc năng lực nền tảng để tùy chỉnh sâu thường hiệu quả hơn, tự do hơn, và cũng dễ tạo ra các workflow phù hợp với thói quen cá nhân. Nhìn về tương lai, ông cho rằng AI sẽ trở thành một lối vào thống nhất: người dùng chỉ cần tương tác thông qua một “trung tâm AI” là có thể gọi nhiều công cụ và hệ thống để hoàn thành mọi tác vụ. Khi mức độ sử dụng tăng lên, AI sẽ liên tục tích lũy bộ nhớ, sở thích và workflow của người dùng, tạo hiệu ứng bánh đà giữa dữ liệu và năng lực (data and capability flywheel), khiến AI ngày càng hiểu người dùng hơn và hiệu suất ngày càng cao hơn. Với xu hướng này, cá nhân có thể đạt mức tăng năng suất vượt xa lao động truyền thống thông qua việc cấu hình hệ thống AI và chi phí thanh toán thuê bao, từ đó tạo chênh lệch hiệu suất rõ rệt giữa người với người.

0xOlivia, đồng sáng lập ClawFirm.dev, tiết lộ rằng trong sử dụng thực tế, AI vẫn tồn tại các vấn đề như hệ thống không ổn định và khả năng ghi nhớ/tự động hóa bị phân mảnh; người dùng cần liên tục ghép nối nhiều công cụ và script khác nhau như lắp LEGO. Đối với người dùng không phải bậc cao, việc trực tiếp dùng các nền tảng thương mại trưởng thành và kết hợp năng lực ứng dụng chính thức cùng khả năng lặp lại liên tục, thường ổn định và hiệu quả hơn nhiều so với hệ thống tự xây dựng phân mảnh cao. Ngoài ra, việc đưa thêm các thành phần mã nguồn mở vào cũng có thể tăng cường hơn nữa năng lực xử lý dữ liệu và tạo nội dung. Cô nhấn mạnh rằng giới hạn chính của AI hiện nay không nằm ở năng lực của mô hình bản thân, mà nằm ở cách sử dụng theo hướng kỹ thuật (engineering) vẫn chưa khớp hoàn toàn với năng lực của mô hình; vì vậy vẫn còn không gian rất lớn để tối ưu và triển khai. Trong tương lai, khi năng lực của các mô hình lớn đang nhanh chóng được tăng cường, các kịch bản ứng dụng của AI sẽ dần bao phủ mọi mặt của công việc và đời sống, đồng thời tiếp tục hòa nhập với nhiều hình thái sản phẩm khác nhau.

Sáng lập viên Biteye/XHunt, Teddy, khi nói về nhân viên số (AI digital employee), đã chỉ ra rằng có thể kết nối AI vào hệ thống nội bộ thông qua API hoặc giao diện tự động hóa, để AI đảm nhận các nhiệm vụ thực thi cụ thể như tạo mã, hiện thực hóa yêu cầu, xử lý nội dung; còn con người tập trung vào thiết kế sản phẩm và xác định yêu cầu, qua đó giữ quyền ra quyết định cốt lõi. Mô hình phối hợp này ổn định và mở rộng tốt hơn: không chỉ nâng cao hiệu suất phát triển tổng thể mà còn giảm đáng kể tỷ lệ lỗi, khiến AI giống như một đội “gia công” có thể điều phối và quản lý, thay vì chỉ là một công cụ đơn lẻ. Cô/anh cũng đồng thời nhấn mạnh rằng, mọi công việc mang tính quy trình và lặp lại mạnh đều có khả năng được AI cải tạo hoặc thay thế; dù hiệu quả ban đầu có thể không ổn định, thì về lâu dài vẫn sẽ tiếp tục tối ưu và tăng dần năng suất. Trong lĩnh vực tác vụ phức tạp và quyết định quản lý, AI cũng đã bắt đầu thể hiện năng lực hỗ trợ đáng kể và đang thâm nhập vào các kịch bản kinh doanh cấp cao hơn.

Kỹ sư phát triển ứng dụng AI cấp cao, Đậu Gô, bổ sung chỉ ra rằng mọi người nhìn chung đồng thuận về xu hướng AI hóa ngoài dịch vụ (AI outsourcing), tự động hóa và hợp tác theo kiểu công cụ hóa; còn từ góc độ doanh nghiệp, thì càng cần ưu tiên cân nhắc bảo mật, quản lý quyền, cơ chế phối hợp nhân viên và việc tích lũy tài sản. Hiện trên thị trường có nhiều framework và hệ sinh thái công cụ phát triển AI khác nhau; mỗi bên có thiên hướng riêng theo các hướng như nhẹ, low-code, tích hợp cao và kiểm soát bảo mật. Khi doanh nghiệp lựa chọn, cần cân bằng giữa tính linh hoạt và tính kiểm soát, đồng thời thiết kế kiến trúc gắn với bối cảnh kinh doanh thực tế. Và việc thực sự hiểu và triển khai các hệ thống AI này không thể chỉ dừng ở tầng lý thuyết mà cần đầu tư và chi phí vận hành thực tế. Ông nhấn mạnh rằng AI đang tăng tốc tái định hình workflow và cấu trúc tổ chức; dù là cá nhân hay doanh nghiệp đều phải nhanh chóng thích ứng với sự thay đổi này, bằng cách học tập liên tục và áp dụng theo hướng công cụ hóa để nâng cao hiệu suất, nếu không rất dễ bị bỏ lại do tốc độ lặp đổi của công nghệ.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim