Công ty khởi nghiệp trí tuệ nhân tạo Trung Quốc MiniMax đã ra mắt mô hình AI hoàn toàn mới M2.1, một lần nữa thách thức cuộc cạnh tranh AI sinh tổng hợp toàn cầu. Mô hình này đã tăng cường đáng kể khả năng đa dạng hóa ngôn ngữ lập trình và khả năng ứng phó với môi trường làm việc thực tế, không chỉ trong hỗ trợ mã mà còn thể hiện hiệu suất cải thiện toàn diện trong việc soạn thảo tài liệu và trả lời cuộc đối thoại.
Phiên bản M2.1 được phát hành lần này đã nâng cao đáng kể khả năng hiểu và chính xác trong việc tạo ra nhiều ngôn ngữ lập trình khác nhau thông qua việc cải tiến hiệu suất so với mô hình trước đó là M2. Ngôn ngữ hỗ trợ đã được mở rộng đến Rust, Java, Go, C++, Kotlin, Objective-C, TypeScript, JavaScript, và khả năng thiết kế giao diện người dùng cũng như thẩm mỹ trên các nền tảng Web, Android, iOS đã nhận được đánh giá cải thiện đáng kể.
Đặc biệt, M2.1 không chỉ củng cố tính chính xác trong việc thực hiện mã đơn giản, mà còn nâng cao khả năng hiểu và tuân theo các chỉ dẫn nhiệm vụ phức tạp hoặc hướng dẫn chi tiết, từ đó xây dựng một AI phù hợp hơn với môi trường làm việc thực tế. MiniMax đã nâng cao khả năng đối thoại và khả năng viết tài liệu của mô hình, và giải thích rằng nó thể hiện hiệu suất xuất sắc trong một phạm vi rộng từ đối thoại hàng ngày đến viết tài liệu kỹ thuật và phản hồi có cấu trúc.
Người đồng sáng lập và Giám đốc điều hành của nền tảng mã nguồn mở AI Kilo Code, Scott Breitenother cho biết: “Trong các thử nghiệm ban đầu, M2.1 đã thể hiện kết quả xuất sắc trong toàn bộ quy trình phát triển, bao gồm thiết kế kiến trúc, lập trình mã, đánh giá và triển khai” và đánh giá rằng mô hình này đồng thời đáp ứng hiệu quả chi phí và hiệu suất cao.
Mô hình này cũng được đánh giá thông qua một chỉ số chuẩn mới có tên là VIBE (Chỉ số Thị giác và Tương tác cho Thực thi). VIBE được xây dựng dựa trên năm lĩnh vực cốt lõi: Web, mô phỏng, Android, iOS và phát triển backend, thông qua ngôn ngữ xác thực dựa trên đại lý để đánh giá tổng thể logic tương tác và các yếu tố thị giác của kết quả được tạo ra. Theo MiniMax, M2.1 đã đạt điểm trung bình 88,6 trong bài kiểm tra chuẩn này, trong đó đạt điểm xuất sắc lần lượt là 91,5 và 89,7 trong các lĩnh vực Web và Android.
M2.1 cũng đã so sánh hiệu suất với các mô hình AI chính thống. Trong kết quả đánh giá ngang hàng với các mô hình chủ lực của các nhà sản xuất lớn như Anthropic, Google, OpenAI, DeepSeek, M2.1 cũng thể hiện khả năng giải quyết vấn đề mạnh mẽ trong các bài kiểm tra chuẩn khó như “Kỳ thi cuối cùng của nhân loại” và “Toolathon”. Đặc biệt, trong dự án HLE w/o Tools, nó đạt 22.0 điểm, trong bài kiểm tra tổng hợp lĩnh vực Khoa học Nhân văn·Kỹ thuật MMLU(Pro) đạt 88 điểm, sánh ngang với các mô hình AI hàng đầu.
M2.1 hiện có thể tải xuống qua API riêng của MiniMax hoặc Hugging Face, dịch vụ đại diện công ty cho MiniMax cũng dựa trên M2.1. Việc phát hành mô hình lần này cho thấy hỗ trợ mã hóa đa ngôn ngữ và thị trường đại lý AI đang phát triển nhanh chóng, cũng như báo hiệu rằng tính phổ biến và sức cạnh tranh của AI sinh ra từ Trung Quốc đang tiếp tục mở rộng.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Mini Max của Trung Quốc, một lần nữa thách thức cuộc chiến tạo sinh toàn cầu với mô hình AI 'M2.1'
Công ty khởi nghiệp trí tuệ nhân tạo Trung Quốc MiniMax đã ra mắt mô hình AI hoàn toàn mới M2.1, một lần nữa thách thức cuộc cạnh tranh AI sinh tổng hợp toàn cầu. Mô hình này đã tăng cường đáng kể khả năng đa dạng hóa ngôn ngữ lập trình và khả năng ứng phó với môi trường làm việc thực tế, không chỉ trong hỗ trợ mã mà còn thể hiện hiệu suất cải thiện toàn diện trong việc soạn thảo tài liệu và trả lời cuộc đối thoại.
Phiên bản M2.1 được phát hành lần này đã nâng cao đáng kể khả năng hiểu và chính xác trong việc tạo ra nhiều ngôn ngữ lập trình khác nhau thông qua việc cải tiến hiệu suất so với mô hình trước đó là M2. Ngôn ngữ hỗ trợ đã được mở rộng đến Rust, Java, Go, C++, Kotlin, Objective-C, TypeScript, JavaScript, và khả năng thiết kế giao diện người dùng cũng như thẩm mỹ trên các nền tảng Web, Android, iOS đã nhận được đánh giá cải thiện đáng kể.
Đặc biệt, M2.1 không chỉ củng cố tính chính xác trong việc thực hiện mã đơn giản, mà còn nâng cao khả năng hiểu và tuân theo các chỉ dẫn nhiệm vụ phức tạp hoặc hướng dẫn chi tiết, từ đó xây dựng một AI phù hợp hơn với môi trường làm việc thực tế. MiniMax đã nâng cao khả năng đối thoại và khả năng viết tài liệu của mô hình, và giải thích rằng nó thể hiện hiệu suất xuất sắc trong một phạm vi rộng từ đối thoại hàng ngày đến viết tài liệu kỹ thuật và phản hồi có cấu trúc.
Người đồng sáng lập và Giám đốc điều hành của nền tảng mã nguồn mở AI Kilo Code, Scott Breitenother cho biết: “Trong các thử nghiệm ban đầu, M2.1 đã thể hiện kết quả xuất sắc trong toàn bộ quy trình phát triển, bao gồm thiết kế kiến trúc, lập trình mã, đánh giá và triển khai” và đánh giá rằng mô hình này đồng thời đáp ứng hiệu quả chi phí và hiệu suất cao.
Mô hình này cũng được đánh giá thông qua một chỉ số chuẩn mới có tên là VIBE (Chỉ số Thị giác và Tương tác cho Thực thi). VIBE được xây dựng dựa trên năm lĩnh vực cốt lõi: Web, mô phỏng, Android, iOS và phát triển backend, thông qua ngôn ngữ xác thực dựa trên đại lý để đánh giá tổng thể logic tương tác và các yếu tố thị giác của kết quả được tạo ra. Theo MiniMax, M2.1 đã đạt điểm trung bình 88,6 trong bài kiểm tra chuẩn này, trong đó đạt điểm xuất sắc lần lượt là 91,5 và 89,7 trong các lĩnh vực Web và Android.
M2.1 cũng đã so sánh hiệu suất với các mô hình AI chính thống. Trong kết quả đánh giá ngang hàng với các mô hình chủ lực của các nhà sản xuất lớn như Anthropic, Google, OpenAI, DeepSeek, M2.1 cũng thể hiện khả năng giải quyết vấn đề mạnh mẽ trong các bài kiểm tra chuẩn khó như “Kỳ thi cuối cùng của nhân loại” và “Toolathon”. Đặc biệt, trong dự án HLE w/o Tools, nó đạt 22.0 điểm, trong bài kiểm tra tổng hợp lĩnh vực Khoa học Nhân văn·Kỹ thuật MMLU(Pro) đạt 88 điểm, sánh ngang với các mô hình AI hàng đầu.
M2.1 hiện có thể tải xuống qua API riêng của MiniMax hoặc Hugging Face, dịch vụ đại diện công ty cho MiniMax cũng dựa trên M2.1. Việc phát hành mô hình lần này cho thấy hỗ trợ mã hóa đa ngôn ngữ và thị trường đại lý AI đang phát triển nhanh chóng, cũng như báo hiệu rằng tính phổ biến và sức cạnh tranh của AI sinh ra từ Trung Quốc đang tiếp tục mở rộng.