Đại học Giao thông Thượng Hải và Tencent phát triển tác nhân AI ProAct có khả năng dự đoán nhu cầu của người dùng

OliverGrant

Các nhà nghiên cứu tại Đại học Giao thông Thượng Hải và tập đoàn công nghệ Tencent đã phát triển ProAct, một tác nhân AI được thiết kế để dự đoán nhu cầu của người dùng trước khi họ gửi truy vấn. Hệ thống sử dụng thời gian rảnh giữa các cuộc hội thoại để rà soát các tương tác trước đó và chuẩn bị thông tin trước. Theo bài nghiên cứu, ProAct hoạt động tốt hơn các hệ thống AI chủ động trước đó trong thử nghiệm benchmark, dù các thí nghiệm không liên quan đến người dùng thực. Việc phát triển này nhằm giải quyết điều mà các nhà nghiên cứu mô tả là cơ hội tính toán bị lãng phí trong các tác nhân AI hiện tại, vốn về bản chất vẫn chỉ phản ứng.

Hệ thống hoạt động qua quy trình dự đoán nhiều giai đoạn

ProAct vận hành thông qua nhiều giai đoạn, giúp nó khác biệt với các tác nhân AI thông thường. Giai đoạn đầu tiên, gọi là Dự đoán Trạng thái Tương lai (Future-State Prediction), phân tích các cuộc hội thoại trước đây, sở thích của người dùng và những thông tin còn thiếu để dự đoán các câu hỏi tiếp theo có khả năng xảy ra. Giai đoạn thứ hai, Thu thập Thời gian rảnh (Idle-Time Acquisition), đánh giá dự đoán nào xứng đáng được nghiên cứu dựa trên mức độ liên quan, thời điểm và tiềm năng hữu ích của thông tin mới. Một hệ thống riêng xác định liệu có nên trình bày thông tin đã chuẩn bị ngay lập tức, lưu lại để dùng sau hay lưu trữ cho đến khi cần.

“Sau mỗi tương tác nổi bật ở phía trước, tác nhân sẽ cập nhật bộ nhớ, dự đoán các nhu cầu có thể phát sinh trong tương lai, phân bổ thời gian tính toán rảnh cho các ứng viên đáng giá và quyết định cách xử lý phần chuẩn bị thu được”, các nhà nghiên cứu viết trong bài báo. “Cách diễn đạt này gắn kết dự đoán, thu thập và phân phối vào cùng một chính sách, thay vì coi việc tính toán trong thời gian rảnh là một hoạt động tìm kiếm nền không bị ràng buộc.”

Thử nghiệm benchmark cho thấy cải thiện hiệu năng

Các nhà nghiên cứu đã thử nghiệm ProAct trong 200 mô phỏng trên 40 lĩnh vực, bao gồm lập kế hoạch tài chính, quản lý phát hành phần mềm và an ninh mạng. Theo bài báo, hệ thống giúp giảm số lượt trong hội thoại 14,8% và cắt giảm 11,7% các yêu cầu theo sau. Trong một so sánh sử dụng benchmark có tên ProActEval, ProAct dự đoán 703 nhu cầu người dùng có thể đoán trước, so với 32 ở hệ thống trước đó. Các nhà nghiên cứu cũng báo cáo mức giảm 28,1% tình trạng bịa đặt (hallucinations).

“Dù các tác nhân AI thể hiện năng lực đáng kinh ngạc trong lập luận và sử dụng công cụ, chúng vẫn về bản chất là phản ứng: Chúng chỉ tính toán câu trả lời sau khi người dùng đưa ra yêu cầu rõ ràng”, các nhà nghiên cứu viết. “Mô hình này bỏ qua một cơ hội quan trọng: Thời gian rảnh giữa các tương tác phần lớn bị lãng phí, khiến tác nhân không thể chuẩn bị cho các nhu cầu của người dùng trong tương lai.”

Nghiên cứu thừa nhận các hạn chế của hệ thống

Các nhà nghiên cứu đã thừa nhận một số hạn chế trong nghiên cứu ProAct. Trong 3% trường hợp, hệ thống tạo ra phản hồi tệ hơn bằng cách đưa ra thông tin không liên quan. Bài báo nêu rằng phiên bản triển khai ngoài thực tế sẽ cần các biện pháp bảo vệ quyền riêng tư, vì hệ thống liên tục phân tích hội thoại và lưu trữ dữ liệu người dùng.

“Phân tích ngân sách của chúng tôi cũng cho thấy, các ngân sách Thu thập Thời gian rảnh lớn hơn sẽ làm tăng chi phí active-token và mang lại lợi ích giảm dần”, các nhà nghiên cứu viết, “vì vậy tính toán chủ động là sự đánh đổi tại một điểm vận hành, chứ không phải thứ cần tối đa hóa.”

Nghiên cứu xuất hiện trong bối cảnh các tác nhân AI tự động lan rộng khắp ngành công nghệ, với các dự án như OpenClaw và Hermes Agent cung cấp các trợ lý AI bền bỉ, xử lý các tác vụ như viết mã, lập lịch, nghiên cứu và tự động hóa quy trình làm việc. Các nhà nghiên cứu riêng rẽ trước đó vào đầu tháng này cũng cảnh báo rằng các tác nhân AI có thể thực hiện các nhiệm vụ nguy hiểm mà không hiểu hậu quả. “Giống như ông Magoo, các tác nhân này tiến về phía một mục tiêu mà không hiểu đầy đủ hậu quả của hành động,” tác giả chính Erfan Shayegani, nghiên cứu sinh tiến sĩ tại UC Riverside, cho biết trong một tuyên bố.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận