GLM-5.1 занимает первое место в кодовом рейтинге LMArena; исходный код — №1 в мире и №3 в мире

Gate News новости, 10 апреля, сегодня глобальная авторитетная платформа для оценок ИИ LMArena (платформа для оценки моделей ИИ, в которой участвуют миллионы пользователей, проводя слепые тесты) обновила специализированный рейтинг Code Arena. GLM-5.1 заняла первое место среди глобальных моделей с открытым исходным кодом, а также находится на третьем месте в мире среди всех моделей.

GLM-5.1 не только унаследовала возможности с открытым исходным кодом на уровне SOTA из предыдущего поколения моделей для кодирования, но и добилась прорыва в задачах с длительным горизонтом (Long-Horizon Task), реализовав: сборку Linux-десктопа с нуля за 8 часов; 655 итераций, которые позволили преодолеть узкое место оптимизации в векторных базах данных; 1000 раундов оптимизации вызовов инструментов под реальные нагрузки машинного обучения.

Отдельно стоит отметить, что при одинаковых критериях оценки в рейтинге METR GLM-5.1 — единственная модель с открытым исходным кодом, достигшая уровня 8 часов непрерывной работы, и одна из немногих моделей в мире, обладающих этой способностью, кроме Claude Opus 4.6.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Акции Alibaba растут более чем на 3%: Alibaba Cloud объявляет о повышении цен на ИИ-услуги

16 апреля акции Alibaba выросли более чем на 3% после объявления о повышении цен на ее ИИ-услуги для стабилизации поставок и операционной деятельности. Компания также представила Happy Oyster — инновационную модель для трехмерных сред, ориентированную на индустрии игр и кино, — при этом стремясь увеличить выручку от ИИ и облака до $100 billion за пять лет.

GateNews2ч назад

ЕС обязывает Google открыть данные поиска конкурентам и AI-чатботам, меняя ландшафт поиска

Европейская комиссия обязала Google делиться своими базовыми данными поисковой выдачи с конкурентами и AI-чатботами в рамках Digital Markets Act. Цель — способствовать конкуренции, предоставив AI-сервисам вроде ChatGPT доступ к ценной пользовательской информации. Google планирует оспорить это решение, ссылаясь на опасения по поводу конфиденциальности.

GateNews2ч назад

Google и Boston Dynamics интегрируют модели ИИ Gemini в робота Spot для управления на естественном языке и выполнения задач

Google и Boston Dynamics интегрировали модели Gemini Robotics в робота Spot, позволяя ему понимать команды на естественном языке, распознавать объекты и автономно выполнять задачи, повышая эффективность и адаптивность в робототехнике.

GateNews3ч назад

Создатель Nas Daily Нусейр Яссин привлек $27M в Series A для платформы для AI-бизнеса

Nas.com, основанная Нусейром Яссином (Nuseir Yassin) из Nas Daily, привлекла $27 млн в рамках раунда финансирования Series A под руководством Khosla Ventures. Это подчеркивает тенденцию к тому, что создатели переходят в технологии, используя свою аудиторию для роста бизнеса.

GateNews3ч назад

Sama уволит более 1,100 работников из Кении после окончания контракта с Meta

Samasource Impact Sourcing Inc уволит более 1,100 сотрудников в Найроби из-за расторжения Meta ключевого контракта. Несмотря на попытки сохранить рабочие места, зависимость компании от крупных технологических клиентов в США подчеркивает нестабильность сектора аутсорсинга ИИ в Африке.

GateNews3ч назад

Claude Opus 4.7 от Anthropic: рассуждения развиваются дальше, больше не просто инструмент для ответов

Claude Opus 4.7, выпущенный Anthropic, усилил способности к рассуждению и обработке длинных текстов: он преобразовался из инструмента для ответов в помощника для принятия решений, повысив понимание контекста и уровень безопасности. Это обновление показывает, что акцент конкурентной борьбы в отрасли смещается с производительности моделей к практической применимости; оно знаменует переход генеративного ИИ от экспериментальных технологий к зрелым приложениям.

ChainNewsAbmedia3ч назад
комментарий
0/400
Нет комментариев