Gate News новости, 10 апреля, сегодня глобальная авторитетная платформа для оценок ИИ LMArena (платформа для оценки моделей ИИ, в которой участвуют миллионы пользователей, проводя слепые тесты) обновила специализированный рейтинг Code Arena. GLM-5.1 заняла первое место среди глобальных моделей с открытым исходным кодом, а также находится на третьем месте в мире среди всех моделей.
GLM-5.1 не только унаследовала возможности с открытым исходным кодом на уровне SOTA из предыдущего поколения моделей для кодирования, но и добилась прорыва в задачах с длительным горизонтом (Long-Horizon Task), реализовав: сборку Linux-десктопа с нуля за 8 часов; 655 итераций, которые позволили преодолеть узкое место оптимизации в векторных базах данных; 1000 раундов оптимизации вызовов инструментов под реальные нагрузки машинного обучения.
Отдельно стоит отметить, что при одинаковых критериях оценки в рейтинге METR GLM-5.1 — единственная модель с открытым исходным кодом, достигшая уровня 8 часов непрерывной работы, и одна из немногих моделей в мире, обладающих этой способностью, кроме Claude Opus 4.6.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Акции Alibaba растут более чем на 3%: Alibaba Cloud объявляет о повышении цен на ИИ-услуги
16 апреля акции Alibaba выросли более чем на 3% после объявления о повышении цен на ее ИИ-услуги для стабилизации поставок и операционной деятельности. Компания также представила Happy Oyster — инновационную модель для трехмерных сред, ориентированную на индустрии игр и кино, — при этом стремясь увеличить выручку от ИИ и облака до $100 billion за пять лет.
GateNews2ч назад
ЕС обязывает Google открыть данные поиска конкурентам и AI-чатботам, меняя ландшафт поиска
Европейская комиссия обязала Google делиться своими базовыми данными поисковой выдачи с конкурентами и AI-чатботами в рамках Digital Markets Act. Цель — способствовать конкуренции, предоставив AI-сервисам вроде ChatGPT доступ к ценной пользовательской информации. Google планирует оспорить это решение, ссылаясь на опасения по поводу конфиденциальности.
GateNews2ч назад
Google и Boston Dynamics интегрируют модели ИИ Gemini в робота Spot для управления на естественном языке и выполнения задач
Google и Boston Dynamics интегрировали модели Gemini Robotics в робота Spot, позволяя ему понимать команды на естественном языке, распознавать объекты и автономно выполнять задачи, повышая эффективность и адаптивность в робототехнике.
GateNews3ч назад
Создатель Nas Daily Нусейр Яссин привлек $27M в Series A для платформы для AI-бизнеса
Nas.com, основанная Нусейром Яссином (Nuseir Yassin) из Nas Daily, привлекла $27 млн в рамках раунда финансирования Series A под руководством Khosla Ventures. Это подчеркивает тенденцию к тому, что создатели переходят в технологии, используя свою аудиторию для роста бизнеса.
GateNews3ч назад
Sama уволит более 1,100 работников из Кении после окончания контракта с Meta
Samasource Impact Sourcing Inc уволит более 1,100 сотрудников в Найроби из-за расторжения Meta ключевого контракта. Несмотря на попытки сохранить рабочие места, зависимость компании от крупных технологических клиентов в США подчеркивает нестабильность сектора аутсорсинга ИИ в Африке.
GateNews3ч назад
Claude Opus 4.7 от Anthropic: рассуждения развиваются дальше, больше не просто инструмент для ответов
Claude Opus 4.7, выпущенный Anthropic, усилил способности к рассуждению и обработке длинных текстов: он преобразовался из инструмента для ответов в помощника для принятия решений, повысив понимание контекста и уровень безопасности. Это обновление показывает, что акцент конкурентной борьбы в отрасли смещается с производительности моделей к практической применимости; оно знаменует переход генеративного ИИ от экспериментальных технологий к зрелым приложениям.
ChainNewsAbmedia3ч назад