Tin Gate News, ngày 20 tháng 4 — Các mô hình AI hàng đầu tỏ ra xuất sắc trong việc giải các vấn đề phức tạp như toán Olympic, nhưng lại gặp khó khăn với công việc doanh nghiệp thường nhật, theo David Meyer của Databricks. Một số mô hình có thể sửa một mã số hóa đơn sai thay vì gắn cờ đó là lỗi, trong khi các công cụ lập trình như Claude cũng có thể hoạt động kém hiệu quả trong các tác vụ kỹ thuật dữ liệu.
Khoảng cách này xuất phát từ sự khác biệt cơ bản giữa dữ liệu doanh nghiệp và văn bản công khai trên web được dùng để huấn luyện các mô hình lớn. Dữ liệu doanh nghiệp thường có nhãn cột mơ hồ, nhiều trường trống và các mã được lưu dưới dạng văn bản thuần. Trong một nghiên cứu học thuật, điểm F1 của một mô hình AI—điểm cân bằng giữa độ chính xác và độ thu hồi—giảm từ 0.94 trên dữ liệu công khai xuống 0.07 trên dữ liệu doanh nghiệp cho một tác vụ kỹ thuật dữ liệu. Ngoài ra, các mô hình lớn thường mặc định theo những khuôn mẫu quen thuộc từ quá trình huấn luyện; một số mô hình mặc định sang Structured Query Language (SQL) dù đã nhận được hướng dẫn và tài liệu về ngôn ngữ truy vấn độc quyền của một công ty.
Các mô hình nguồn mở nhỏ được tinh chỉnh bằng học tăng cường có thể xử lý các công việc cụ thể hiệu quả hơn với chi phí huấn luyện thấp hơn đáng kể so với các mô hình tổng quát lớn. Databricks đang xây dựng các tác nhân AI nhỏ cho các quy trình làm việc cụ thể, như KARL, sử dụng học tăng cường cho suy luận nhiều bước với tài liệu của công ty. Ngành đang chuyển từ việc phụ thuộc vào các mô hình khổng lồ sang các kiến trúc lai, trong đó các mô hình nhỏ hiệu quả xử lý khối lượng thường ngày, rồi chỉ nâng cấp lên các hệ thống lớn hơn, tốn kém hơn cho những trường hợp không rõ ràng hoặc phức tạp.
Gần đây Databricks đã mua Quotient AI để giúp các doanh nghiệp lớn chạy các tác nhân AI đáng tin cậy hơn. Cuộc cạnh tranh trong mảng kinh doanh AI hiện tập trung vào việc vận hành toàn bộ vòng đời AI, bao gồm các hệ thống phản hồi để theo dõi lỗi và liên tục cải thiện mô hình theo thời gian, khiến các công cụ đánh giá và tinh chỉnh ngày càng có giá trị sau khi triển khai.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Thực tế của AI Agent ở Thung lũng Silicon: lãng phí hàng loạt token, tích hợp hệ thống “cực kỳ hỗn loạn”, dự đoán của Hoàng Nhân Quân “ChatGPT tiếp theo” vẫn cần được xác minh
Trong hội nghị gần đây ở Thung lũng Silicon, nhiều CEO của các startup AI đã đưa ra quan điểm về các vấn đề khi sử dụng AI agent hiện nay, cho rằng đang phải đối mặt với hai khó khăn lớn là lãng phí token và hệ thống bị rối loạn. Các chuyên gia cho biết, doanh nghiệp cần đánh giá kỹ hơn khi nào nên sử dụng mô hình ngôn ngữ lớn, nhằm tránh lãng phí tài nguyên không cần thiết. Ngoài ra, sự phối hợp giữa nhiều AI agent thường gây ra các vấn đề về truyền thông tin và tính nhất quán trạng thái, cho thấy việc tiêu chuẩn hóa hiện nay vẫn cần được cải thiện. Mặc dù ông Hoàng Nhân Huân đề cập đến quan điểm về chỉ số lương token, phản hồi cho thấy điều này không đồng nghĩa với năng suất; giá trị thực sự nằm ở việc thiết kế nhiệm vụ hiệu quả.
ChainNewsAbmedia13giờ trước
AI 吞噬全球创投 80%,Q1 2026 吸走 2,420 亿美元:Crypto 业者如何因应资金重分配
Theo báo cáo, tổng vốn đầu tư mạo hiểm toàn cầu trong quý 1 năm 2026 gần đạt 300 tỷ đô la Mỹ, trong đó các công ty liên quan đến AI chiếm riêng khoảng 242 tỷ đô la Mỹ, tương đương 80% vốn đầu tư mạo hiểm. Điều này cho thấy AI đã trở thành trọng tâm chính của đầu tư mạo hiểm. Khi dòng vốn tập trung vào AI, các lĩnh vực khác như crypto bị chèn ép, các doanh nghiệp cần điều chỉnh chiến lược, tích hợp sâu hơn AI vào hoạt động kinh doanh của mình, và dự kiến sẽ xuất hiện xu hướng hợp nhất cơ sở hạ tầng.
ChainNewsAbmedia17giờ trước
Robot hình người giành danh dự chiến thắng Half Marathon Yizhuang Bắc Kinh 2026 trong 50 phút 26 giây
Giải Half Marathon Yizhuang Bắc Kinh 2026 có sự tham gia của các robot hình người thi đấu, chạy 21,0975 km. Đội tự hành Qitian Dasheng giành chiến thắng với thời gian 50:26, trong khi đội điều khiển từ xa Jueying Chitu về đích đầu tiên theo thời gian thực nhưng xếp hạng thấp hơn do bị phạt.
GateNews18giờ trước
Cảnh sát Hồng Kông cảnh báo lừa đảo tiền mã hóa “giao dịch định lượng bằng AI”, phụ nữ mất 7,7 triệu HKD
Cảnh sát Hồng Kông đã tiết lộ một vụ lừa đảo tiền mã hóa, trong đó một phụ nữ bị mất 7,7 triệu HKD do các đối tượng lừa đảo giả làm chuyên gia đầu tư thông qua Telegram, hứa hẹn lợi nhuận cao nhờ giao dịch định lượng bằng AI. Cảnh sát đã cảnh báo công chúng về những rủi ro liên quan đến các khoản đầu tư tiền mã hóa.
GateNews19giờ trước
Đồng sáng lập Ethereum Lubin: AI sẽ là bước ngoặt then chốt cho crypto, nhưng độc quyền của các gã khổng lồ công nghệ tạo ra rủi ro mang tính hệ thống
Đồng sáng lập Ethereum Joseph Lubin nhấn mạnh tiềm năng mang tính đột phá của AI đối với lĩnh vực tiền mã hóa, đồng thời cảnh báo về các rủi ro của việc tập trung hóa giữa các gã khổng lồ công nghệ. Ông hình dung các giao dịch tự động do AI thúc đẩy trên blockchain và nhấn mạnh sự hội tụ giữa tài chính truyền thống với DeFi.
GateNews04-18 14:01
Luffa hợp tác với nền tảng tài sản kỹ thuật số để tích hợp giao dịch crypto do AI hỗ trợ
Luffa, một hệ sinh thái xã hội Web3, đã hợp tác với một nền tảng giao dịch tài sản kỹ thuật số để tích hợp các tính năng giao dịch do AI điều khiển, nâng cao giao tiếp và giao dịch an toàn trong một giao diện thống nhất đồng thời vẫn duy trì tính phi tập trung và giảm thiểu rủi ro.
GateNews04-18 06:31