Tin tức từ Gate, ngày 23 tháng 4 — Các nhà nghiên cứu của Google, bao gồm He Kaiming và Xie Saining, đã công bố một bài báo giới thiệu Vision Banana, một mô hình hiểu thị giác đa dụng được tạo ra thông qua tinh chỉnh hướng dẫn nhẹ của mô hình tạo ảnh Nano Banana Pro (Gemini 3 Pro Image) của công ty. Điểm đổi mới cốt lõi là hợp nhất đầu ra của mọi tác vụ thị giác dưới dạng các ảnh RGB, cho phép phân đoạn, ước lượng độ sâu và dự đoán pháp tuyến bề mặt thông qua tạo ảnh mà không cần kiến trúc hoặc hàm mất mát chuyên cho từng tác vụ.
Trong phân đoạn ngữ nghĩa, Vision Banana vượt trội mô hình chuyên biệt SAM 3 thêm 4,7 điểm phần trăm trên Cityscapes; trong phân đoạn theo biểu thức tham chiếu, nó vượt qua SAM 3 Agent. Tuy nhiên, nó chậm hơn SAM 3 trong phân đoạn theo thể hiện (instance segmentation). Với các tác vụ 3D, ước lượng độ sâu theo chuẩn metric đạt độ chính xác trung bình 0,929 trên bốn bộ dữ liệu chuẩn, vượt Depth Anything V3 ở mức 0,918, chỉ sử dụng dữ liệu tổng hợp mà không cần thông tin độ sâu thực hay tham số camera trong khi suy luận. Ước lượng pháp tuyến bề mặt đạt kết quả hiện đại nhất trên ba bộ benchmark trong nhà.
Việc tinh chỉnh liên quan đến dữ liệu tác vụ thị giác tối thiểu pha trộn vào quá trình huấn luyện tạo ảnh gốc, giữ lại năng lực tạo của mô hình—hiệu năng khớp với Nano Banana Pro ban đầu trong các bài kiểm tra chất lượng tạo ảnh. Bài báo đề xuất rằng việc tiền huấn luyện tạo ảnh trong thị giác song song với việc tiền huấn luyện tạo văn bản trong ngôn ngữ: các mô hình học các biểu diễn bên trong cần thiết cho hiểu ảnh trong quá trình tạo, và việc tinh chỉnh hướng dẫn chỉ đơn giản là mở khóa năng lực này.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Công ty Dữ liệu AI Mercor Bị Tấn Công Bởi Ít Nhất 7 Vụ Kiện Tập Thể Liên Quan Đến Rò Rỉ Dữ Liệu, Giám Sát Máy Tính
Tin tức cổng, ngày 23 tháng 4 — Công ty gán nhãn dữ liệu AI Mercor, được định giá $10 tỷ USD và có trụ sở tại San Francisco, trong vài tuần gần đây đang đối mặt với ít nhất bảy vụ kiện tập thể do vi phạm dữ liệu bên thứ ba. Công ty làm việc với các khách hàng bao gồm OpenAI, Anthropic và Meta, cung cấp dữ liệu phản hồi
GateNews20phút trước
SpaceX Ước Tính Quy Mô Thị Trường Có Thể Phục Vụ Tối Đa Lên Tới 28,5 Tỷ USD, Với 26,5T Đến Từ Ngành AI
Tin tức Gate, ngày 23 tháng 4 — Theo các tài liệu nội bộ, SpaceX ước tính quy mô thị trường có thể phục vụ tối đa (TAM) của mình ở mức 28,5 nghìn tỷ USD. Công ty dự báo rằng hơn 90% của thị trường, tương đương khoảng 26,5 nghìn tỷ USD, sẽ đến từ trí tuệ nhân tạo.
Trí tuệ nhân tạo doanh nghiệp dự kiến sẽ chiếm phần lớn cơ hội thị trường AI, đại diện cho khoảng 22,7 nghìn tỷ USD trong tổng TAM.
GateNews56phút trước
《Sách Naval》Naval ra mắt Quỹ AI USVC, nhà đầu tư cá nhân cũng có thể đầu tư trước khi niêm yết OpenAI, Anthropic
Nhà đầu tư nổi tiếng ở Thung lũng Silicon Naval thuộc hệ sinh thái AngelList mới đây đã ra mắt một quỹ mới mang tên USVC, nhắm đến việc cho phép các nhà đầu tư phổ thông cũng có thể gián tiếp tham gia vào các công ty công nghệ chưa niêm yết nổi tiếng như OpenAI, Anthropic, xAI, Vercel, Crusoe, Sierra và Legora với ngưỡng tham gia thấp nhất là 500 đô la Mỹ.
Phía chính thức đã đóng gói nó như “Đầu tư để xây dựng các công ty của tương lai trước khi mọi thứ trở nên rõ ràng” và nhấn mạnh đây là một quỹ mở cho tất cả nhà đầu tư, không cần có điều kiện tư cách nhà đầu tư được công nhận/đủ điều kiện, nhằm biến tài sản đầu tư mạo hiểm trước đây chỉ thuộc về người giàu và người trong vòng, thành một sản phẩm mà ngay cả nhà đầu tư lẻ cũng có thể tiếp cận.
Chỉ cần 500 đô la là có thể đầu tư vào các công ty AI giai đoạn sớm
Cốt lõi của câu chuyện mà USVC truyền tải rất trực tiếp: khi ngày càng nhiều startup ngôi sao lựa chọn ở lại thị trường tư nhân trong thời gian dài, thì mức tăng trưởng định giá mang tính bùng nổ thực sự thường diễn ra trong I
ChainNewsAbmedia1giờ trước
Tesla sẽ mua công ty phần cứng AI với giá lên tới $2 tỷ
Tin tức Gate, ngày 23 tháng 4 — Tesla cho biết vào ngày 23 tháng 4 rằng họ đã đồng ý mua một công ty phần cứng trí tuệ nhân tạo với giá lên tới $2 tỷ đô la bằng cổ phiếu phổ thông Tesla và các khoản thưởng bằng cổ phiếu.
Khoảng $1,8 tỷ
GateNews1giờ trước
Các công ty luật hàng đầu tính phí hơn 2.000 USD mỗi giờ, hồ sơ tòa án bị phanh phui “AI bịa đặt, sai sót lan tràn”
Một tài liệu của tòa án do hãng luật hàng đầu của Mỹ Sullivan & Cromwell nộp trong vụ phá sản tại Manhattan của Sự Linh Krenvil Inman đã xin lỗi thẩm phán do có khoảng ba mươi lỗi do AI tạo ra, các ví dụ sai sự thật và các điều khoản bịa đặt. Mặc dù có mức phí cao theo giờ và chính sách đào tạo nội bộ, nhưng khi chuẩn bị thực tế thì đã không thực hiện việc kiểm tra, sự việc này lại một lần nữa làm dấy lên thảo luận về việc sử dụng AI trong giới pháp lý và trách nhiệm đạo đức.
ChainNewsAbmedia1giờ trước
DeepSeek phát hành mã nguồn mở TileKernels, thư viện kernel GPU cho đào tạo và suy luận mô hình lớn
Tin tức cổng, ngày 23 tháng 4 — DeepSeek đã phát hành mã nguồn mở TileKernels theo giấy phép MIT, một thư viện kernel GPU được viết bằng TileLang cho đào tạo và suy luận mô hình ngôn ngữ lớn. TileLang là ngôn ngữ chuyên biệt do nhóm tile-ai phát triển để diễn đạt các kernel GPU hiệu năng cao trong
GateNews1giờ trước