GPT-5.4 Ra mắt, hướng phát triển của AI trong tương lai đã rõ ràng hơn. Hiện tại, lĩnh vực AI đã thoát khỏi giao diện hội thoại để tiến tới hệ thống trí tuệ nhân tạo toàn diện, con người đảm nhiệm vai trò thẩm mỹ, AI đảm nhiệm việc thực thi, hướng tới quy trình làm việc hợp tác giữa người và máy.


➤ Các điểm nâng cấp cốt lõi của GPT-5.4
1、Kết hợp khả năng suy luận chung của GPT-5.2 và khả năng lập trình hàng đầu của GPT-5.3-Codex
2、Hỗ trợ cửa sổ 100 vạn token (khoảng 5000 trang tài liệu), giải quyết vấn đề dễ quên của văn bản dài
3、Hoạt động trực tiếp trên máy tính, mô hình có thể nhìn màn hình, sử dụng chuột, gõ bàn phím như người. Trong thử nghiệm OSWorld, tỷ lệ thành công đã vượt qua mức trung bình của con người là 75.0%
4、Giới thiệu chức năng gián đoạn giữa chừng. Cuộc đối thoại không còn cứng nhắc theo lượt, người dùng có thể chèn yêu cầu mới bất cứ lúc nào khi mô hình đang suy nghĩ hoặc trả lời
5、Tối ưu hóa hiệu quả và chi phí, giới thiệu cơ chế Tool Search. Mô hình không cần tải trước tất cả các định nghĩa công cụ, mà tìm kiếm theo nhu cầu, tiết kiệm đáng kể 47% lượng token tiêu thụ.
➤ Tại sao lại như vậy?
Hiện tại, các phòng thí nghiệm AI hàng đầu thế giới đều đối mặt với tường dữ liệu. Đến năm 2026, lượng văn bản, mã nguồn, sách chất lượng cao do toàn nhân loại tạo ra có thể đã được thu thập quy mô lớn bởi các mô hình lớn, việc huấn luyện dựa trên văn bản đã đến giới hạn, như Claude code, codex, openclaw đều tích hợp sâu vào hệ điều hành hiện tại, thay thế một phần thao tác của con người bằng cách gọi hệ thống công cụ, đồng thời có ý thức tự chủ, nhằm hoàn thành nhiệm vụ.
Một điều nhiều người không biết là các mô hình dòng codex được huấn luyện cùng với Khung Codex, nghĩa là, các mô hình dòng codex và Khung Codex là native của nhau, mô hình tự nhiên có thể gọi tất cả các công cụ phát triển trong codex.
➤ Phân tích sâu về hướng phát triển của AI trong tương lai
1. Từ ghép API chuyển sang nguyên bản cấp hệ điều hành
Khả năng Computer Use của GPT-5.4 thể hiện, đã thoát khỏi giao diện hội thoại để mở rộng ra toàn bộ hệ điều hành.
Trước đây, mô hình chỉ viết mã trong một Sandbox hạn chế, sau nâng cấp sẽ có tay chân vật lý. Không chỉ hiểu logic mã, còn có thể hiểu phản hồi hình ảnh khi nhấn, kéo thả, lỗi terminal.
Cấp khung mới sẽ không còn là một đống hàm công cụ đã định sẵn, mà là cảm nhận sâu sắc về OS. Trong quá trình huấn luyện, mô hình đã học cách quan sát màn hình và phản hồi, giúp nó giống như kỹ sư dày dạn, vừa sửa mã, vừa xem UI thay đổi trong trình duyệt để phát triển tự vòng lặp, đã được thể hiện trên codex.
2. Kiến trúc toàn diện gồm hàng triệu ngữ cảnh + thiết kế nhiệm vụ dài hạn + hệ thống ghi nhớ = kiến trúc sư toàn năng
Trong kiến trúc 3 lớp của Codex, lớp mô hình cung cấp suy luận có cấu trúc. 100 vạn token ngữ cảnh của GPT-5.4 về bản chất mở rộng hơn cho loại suy luận này.
Hệ thống ghi nhớ của OpenAI luôn dẫn đầu, với việc ra mắt ghi nhớ không mất mát, ghi nhớ vô hạn. Đặc biệt khi mô hình và khung là native của nhau, mô hình có thể truy xuất toàn bộ thư viện mã nguồn (cỡ hàng triệu token) trong chốc lát, khung có thể chính xác áp dụng các chỉnh sửa vào hàng chục tệp liên quan.
Hiện tại, trong codex đã có thể thực hiện viết lại toàn bộ kiến trúc, hiểu chính xác ý nghĩa của mã.
3. Tìm kiếm và mở rộng công cụ theo thời gian thực
Cơ chế Tool Search của GPT-5.4 giúp khung hiểu rõ hơn về cách mô hình xuất ra, từ đó lấy thêm thông tin ngữ cảnh để thao tác chính xác hơn.
Hướng phát triển trong tương lai là không tải trước hàng nghìn hàng vạn thư viện công cụ (tránh lãng phí Token), mà khi mô hình suy luận đến việc cần một thành phần trực quan dữ liệu, sẽ truy xuất và tải định nghĩa qua Tool Search theo thời gian thực, nghĩa là các kỹ năng hiện tại có thể là sản phẩm trung gian, nhiều công cụ sẽ được tích hợp vào nội dung mô hình, mô hình tự chọn gọi công cụ phù hợp.
Lợi ích là giúp mô hình lớn duy trì hiệu quả Token cực cao. Nó giải quyết nghịch lý càng nhiều công cụ thì mô hình càng ngu, cho phép cây kỹ năng của Agent có thể mở rộng vô hạn, tự tối ưu, tìm ra con đường tối ưu rồi huấn luyện sang thế hệ mô hình tiếp theo.
4. Tương tác thời gian thực, từ đối thoại theo lượt sang chỉnh sửa bất cứ lúc nào
Chức năng gián đoạn giữa chừng của GPT-5.4 phá vỡ trạng thái hộp đen của AI sinh ra, cho phép điều chỉnh kịp thời khi tư duy không đúng.
Về mặt hợp tác, còn nhiều hơn việc đưa ra quyết định của con người, mà còn là hợp tác mở hộp, con người phụ trách thẩm mỹ, xác định yêu cầu, lựa chọn phương án, còn AI đảm nhiệm việc thực thi.
Nhờ khả năng can thiệp thời gian thực, AI từ trạng thái giao nhiệm vụ một lần, trở thành đối tác kỹ thuật có thể chỉnh sửa yêu cầu bất cứ lúc nào.
Hiểu đơn giản mô hình AI Native mới (Codex + GPT-5.4), bắt đầu từ 0 tự chế tạo một chiếc xe đua F1, động cơ, khung sườn, lốp đều được thiết kế từ ngày đầu tiên để đạt tốc độ tối đa.
Trong tương lai, chúng ta có thể không cần tìm mô hình mạnh hơn nữa, mà là hệ thống tích hợp sâu hơn với môi trường phát triển.
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.45KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.45KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.46KNgười nắm giữ:0
    0.00%
  • Vốn hóa:$2.45KNgười nắm giữ:2
    0.00%
  • Ghim