De acordo com a mais recente avaliação Vending-Bench 2 da Andon Labs, o GLM 5.2 ficou em segundo lugar em um teste de simulação de negócios de longo prazo. O benchmark simulou as operações de 365 dias de uma empresa de máquinas de venda automática, com modelos tomando decisões diárias sobre estoque e preços com base em dados financeiros para avaliar a coerência das decisões em tarefas extensas.
As versões do GLM demonstraram crescimento linear consistente, com melhoria média no lucro mensal próxima de US$ 1 mil (GLM 5 obteve média de US$ 4.432, GLM 5.1 atingiu US$ 5.634). Em contraste, o Kimi K2.7 Code teve desempenho inferior ao K2.6, enquanto o Minimax M3 melhorou significativamente em relação ao M2.5, mas permaneceu substancialmente abaixo das séries Kimi e GLM em lucratividade geral.