Tin tức Cổng, ngày 29 tháng 4 — Các nhà nghiên cứu của OpenAI, Sébastien Bubeck và Ernest Ryu, cho biết các hệ thống AI có thể thực hiện phần lớn công việc nghiên cứu của con người trong vòng hai năm, coi toán học là thước đo rõ ràng cho tiến bộ của AI. Khác với các bài kiểm tra hiệu suất mơ hồ, các bài toán mang lại khả năng xác minh chính xác: câu trả lời hoặc đúng hoặc sai, không để chỗ cho sự mơ hồ.
Bubeck cho biết suy nghĩ thật sự của AI cần có khả năng vượt qua các chuỗi suy luận dài. Chỉ một sai sót trong một lập luận nhiều bước sẽ làm sụp đổ toàn bộ chứng minh, khiến việc phát hiện và sửa lỗi ngay trong quá trình trở thành mục tiêu tối thượng đối với các mô hình tiên tiến. Các phòng thí nghiệm nội bộ của OpenAI đã tạo ra hơn mười định lý hoàn toàn mới có thể công bố trên các tạp chí hàng đầu về tổ hợp, cho thấy rằng AI hiện tạo ra các công trình thực sự nguyên bản, đột phá, thay vì chỉ tái tổ hợp các bài báo hiện có.
Tuy nhiên, các đột phá khoa học bền vững đòi hỏi sự tập trung ổn định trong nhiều tuần thử nghiệm. Các hệ thống hiện tại vẫn cần giám sát chặt chẽ của con người để dẫn dắt và xác minh từng lần đổi hướng. Bubeck dùng “thời gian AGI” để đo xem một mô hình có thể độc lập bắt chước suy nghĩ của con người trong bao lâu; hiện tại, các hệ thống hoạt động trong khoảng từ vài ngày đến một tuần, và mục tiêu của ngành là vài tuần hoặc vài tháng để có thể làm việc tự chủ trong các lĩnh vực như sinh học.
Trí nhớ dài hạn là then chốt cho tương lai này. Các cửa sổ chat tiêu chuẩn giới hạn độ sâu—các chứng minh toán học phức tạp thường vượt quá 50 trang—trong khi các kho mã cho thấy việc duy trì các phiên làm việc kéo dài giúp giải quyết vấn đề sâu hơn. Khi AI đạt được tính độc lập và trí nhớ, chuyên môn của con người trở nên có giá trị hơn, không phải ít hơn. Người lao động cần giữ lại kiến thức nền tảng sâu để thách thức và xác minh các câu trả lời của máy, và các tổ chức sẽ cần các bộ lọc tự động và hệ thống danh tiếng mới để duy trì niềm tin giữa một dòng nghiên cứu do AI hỗ trợ tràn ngập.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Nền tảng AI Certifyde huy động $2M triệu USD vốn hạt giống với CEO Ripple Brad Garlinghouse
Theo ChainCatcher, nền tảng ứng dụng AI Certifyde đã công bố hoàn tất vòng tài trợ hạt giống $2 triệu USD. Các nhà đầu tư bao gồm K5 Global, Flamingo Capital và các nhà đầu tư thiên thần như CEO của Ripple Brad Garlinghouse, đồng sáng lập Honey George Ruan và đồng sáng lập Nutra Roland Peralta.
GateNews1giờ trước
DeepSeek Ra Mắt Tính Năng Nhận Diện Hình Ảnh Trong Giai Đoạn Thử Nghiệm Beta
Theo PANews, DeepSeek đã ra mắt tính năng nhận diện hình ảnh của mình vào hôm nay (29 tháng 4), hiện đang trong giai đoạn thử nghiệm beta. Cả người dùng phiên bản web và ứng dụng di động đều có thể được chọn tham gia đợt triển khai beta.
GateNews2giờ trước
Anthropic Ra Mắt 8 Bộ Kết Nối Công Cụ Sáng Tạo Cho Claude, Bao Gồm Blender, Adobe, Autodesk
Anthropic đã công bố một bộ các bộ kết nối công cụ sáng tạo, cho phép Claude trực tiếp điều khiển phần mềm chuyên nghiệp được sử dụng bởi các nhà thiết kế và nhạc sĩ. Tám bộ kết nối ban đầu bao quát mô hình hóa 3D, thiết kế trực quan, sản xuất âm nhạc và biểu diễn trực tiếp, với các đối tác bao gồm Blender, Adobe,
GateNews2giờ trước
Nhà Trắng bỏ qua đánh giá rủi ro của Lầu Năm Góc để triển khai mô hình Mythos của Anthropic vào ngày 29 tháng 4
Theo Whale Factor, Nhà Trắng đang bỏ qua đánh giá rủi ro của Lầu Năm Góc để triển khai mô hình Mythos của Anthropic trên toàn các cơ quan liên bang vào ngày 29 tháng 4. Động thái này nhằm đẩy nhanh năng lực AI của liên bang và bắt kịp tốc độ của các mạng AI phi tập trung. Đây là một sự thay đổi đáng kể
GateNews2giờ trước
Cognizant sẽ mua lại Astreya với giá $600M để mở rộng hoạt động hạ tầng AI
Theo Reuters, vào ngày 29 tháng 4, Cognizant đã đồng ý mua lại Astreya với giá khoảng $600 triệu USD khi công ty mở rộng mảng kinh doanh hạ tầng AI. Astreya là nhà cung cấp dịch vụ CNTT chuyên về hạ tầng AI và dịch vụ trung tâm dữ liệu. Thương vụ dự kiến sẽ được hoàn tất trong quý II
GateNews3giờ trước
30 Plugin Độc Hại Trên ClawHub Ngụy Trang Như Công Cụ AI, Được Tải Xuống Hơn 9.800 Lần
Theo nghiên cứu của nhà nghiên cứu Manifold Ax Sharma, 30 plugin trên ClawHub được ngụy trang như các công cụ AI hợp pháp đã được tải xuống hơn 9.800 lần trong khi bí mật chuyển đổi các trợ lý AI của người dùng thành công nhân tiền mã hóa. Các plugin này, được đăng tải dưới tài khoản imaflytok, trông như các bộ lập lịch tác vụ thông thường a
GateNews3giờ trước