Karpathy Ủng Hộ Đầu Ra HTML cho Các Mô Hình Ngôn Ngữ Lớn, Dự Đoán Video Neural Tương Tác là Hình Thức Tối Hậu

Theo Andrej Karpathy, thành viên sáng lập OpenAI và là người tạo ra khái niệm “vibe coding”, hôm nay ông đã ủng hộ cách tiếp cận của đội Claude Code: dùng HTML thay vì Markdown cho đầu ra của các mô hình ngôn ngữ lớn. Karpathy đã phác thảo lộ trình phát triển cho các giao diện tương tác AI: từ văn bản thuần túy sang Markdown rồi HTML, tiếp theo là nhiều dạng trung gian khác nhau, cuối cùng tiến tới giai đoạn cuối cùng là video thần kinh tương tác được tạo trực tiếp từ các mô hình khuếch tán.

Karpathy cho rằng sự tiến hóa này bắt nguồn từ băng thông của não người. Ông cho biết khoảng một phần ba não người xử lý tín hiệu thị giác song song—một “xa lộ mười làn” cho việc đưa dữ liệu vào. Ông lập luận rằng tương tác người-AI tối ưu là kết hợp đầu vào bằng giọng nói hiệu quả cho con người và đầu ra thị giác băng thông cao (hình ảnh, hoạt ảnh hoặc video) từ AI. Ông khuyến nghị người dùng ngay lập tức bổ sung “cấu trúc câu trả lời dưới dạng HTML” vào prompt như một cải thiện trong ngắn hạn.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Các chất xúc tác vĩ mô dày đặc trong tuần này sắp đổ bộ: Toàn cảnh phân tích từ công bố CPI đến phiên xem xét dự luật CLARITY

2026 年 5 月中旬, thị trường tiền mã hóa đang trải qua một “cửa sổ” nhạy cảm vĩ mô vô cùng hiếm gặp. Dữ liệu CPI tháng 4 của Mỹ được công bố vào ngày 12/5, Hội nghị thượng đỉnh Mỹ-Trung tại Bắc Kinh dự kiến diễn ra từ 13/5 đến 15/5, và Ủy ban Ngân hàng Thượng viện sẽ xem xét dự luật CLARITY (Luật Thị trường Tài sản Kỹ thuật số về Sự Minh bạch) vào ngày 14/5. Ba sự kiện độc lập nhưng có liên hệ chặt chẽ với nhau cùng dồn rơi vào nhau trong vòng chỉ bốn ngày, tạo thành một bài “stress test” theo từng

GateInstantTrends5phút trước

Nền tảng khởi nghiệp giọng nói AI Vapi hoàn tất vòng $50M Series B do Peak XV Partners dẫn dắt

Theo TechCrunch, Vapi, một startup giọng nói AI, đã hoàn tất vòng gọi vốn Series B trị giá 50 triệu USD do Peak XV Partners dẫn dắt, với định giá sau đầu tư vào khoảng 500 triệu USD. Ring, công ty con của Amazon, đã triển khai Vapi để xử lý 100% các cuộc gọi đến của mình sau khi đánh giá hơn 40 nhà cung cấp giọng nói AI, qua đó góp phần thúc đẩy vòng gọi vốn.

GateNews35phút trước

Độ chính xác của GPT-5.4 giảm từ 100% xuống 54% trên ARC-AGI sau nhiều lần tóm tắt bộ nhớ

Theo Beating, một nghiên cứu gần đây về bộ nhớ tác nhân của Dylan Zhang, nghiên cứu sinh tại Đại học Illinois, cho thấy việc tóm tắt lặp đi lặp lại các trải nghiệm của mô hình có thể làm suy giảm hiệu suất thay vì cải thiện nó. Ở các tác vụ ARC-AGI, GPT-5.4 đạt độ chính xác 100% trên 19 bài toán khi không dùng bộ nhớ, nhưng sau nhiều vòng nén bộ nhớ dựa trên các lộ trình lời giải đúng, độ chính xác giảm xuống còn 54%. Tương tự, trong các tác vụ mua sắm WebShop, phương pháp bộ nhớ AWM đạt 0,64 vớ

GateNews47phút trước

NVIDIA và MIT phát hành khung Lightning OPD, nâng cao hiệu quả chưng cất mô lên 4 lần trong khi loại bỏ các vấn đề về bộ nhớ GPU

Theo các báo cáo, các nhà nghiên cứu NVIDIA và MIT đã phát hành Lightning OPD (Offline On-Policy Distillation), một khung hậu huấn luyện mới cho các mô hình ngôn ngữ lớn giúp loại bỏ nhu cầu phải giữ mô hình “teacher” chạy liên tục trong quá trình huấn luyện. Bằng cách tính trước log-probabilities của mô hình teacher ở chế độ offline, khung này cải thiện hiệu quả huấn luyện gấp 4 lần đồng thời giải phóng toàn bộ tài nguyên GPU cho việc huấn luyện mô hình “student”. Trong thử nghiệm trên 8 GPU NV

GateNews1giờ trước

OpenAI mở rộng chương trình Truy cập tin cậy cho hàng chục doanh nghiệp châu Âu vào ngày 12/5

Theo các tin đưa ngày 12/5, OpenAI đã công bố kế hoạch mở rộng Chương trình Truy cập Đáng tin cậy của mình tới hàng chục doanh nghiệp châu Âu.

GateNews1giờ trước

Người thật đóng Transformers! Unitree Technology ra mắt mẫu robot tự hành sản xuất hàng loạt đầu tiên trên toàn cầu, giá bán 570.000 USD

Công ty robot Trung Quốc Unitree Robotics (Hàng Châu) vào ngày 12/5 đã công bố sản phẩm mới thuộc dòng của mình, GD01, một loại cơ giáp chở người có thể chuyển đổi tự do giữa hai chế độ: hình người hai chân và bò leo bốn chân. Có thể nói, đây là việc đưa những cảnh trong phim khoa học viễn tưởng “Transformers” và “Pacific Rim” vào thực tế. Lần ra mắt này không chỉ là một kỳ quan công nghệ, mà còn cho thấy tốc độ đẩy nhanh của ngành công nghiệp robot Trung Quốc. Unitree Unveils: GD01, A Manned Tr

ChainNewsAbmedia2giờ trước
Bình luận
0/400
Không có bình luận