GLM 5.2 занимает второе место в Vending-Bench 2 Long-Term Business Simulation, показывая рост ежемесячной прибыли ~1 000 долларов

Согласно последней оценке Vending-Bench 2 от Andon Labs, GLM 5.2 занял второе место в тесте долгосрочного бизнес-симулятора. Бенчмарк моделировал 365-дневную работу компании по продаже вендинговых автоматов, при этом модели ежедневно принимали решения о запасах и ценообразовании на основе финансовых данных для оценки согласованности решений в течение длительных задач.

Версии GLM продемонстрировали последовательный линейный рост, при этом среднемесячное улучшение прибыли составило около 1 000 долларов (GLM 5 показал среднюю прибыль 4 432 доллара, GLM 5.1 достиг 5 634 долларов). Напротив, Kimi K2.7 Code показал худшие результаты по сравнению с K2.6, в то время как Minimax M3 значительно улучшился по сравнению с M2.5, но остался существенно ниже обеих серий Kimi и GLM по общей прибыльности.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев