Laut dem KI-Bericht von Jefferies, der am 22. Juni veröffentlicht wurde, haben chinesische KI-Modelle in der Woche bis zum 22. Juni 18,8 Billionen Tokens verbraucht und damit US-Modelle mit 5,8 Billionen übertroffen. DeepSeek V4 Flash belegte mit 4,94 Billionen Tokens den ersten Platz, gefolgt von Xiaomis MiMo-V2.5, MiniMax M3 und dem Qwen von Tencent. OpenRouter-Daten zeigten, dass der Tokenverbrauch plattformweit um 4,7% gegenüber der Vorwoche auf 46,7 Billionen gestiegen ist.
Die Veränderung spiegelt den Wettbewerbsvorteil chinesischer Modelle zwischen Leistung und Kosten wider. Jefferies stellte fest, dass chinesische Modelle den Intelligenzabstand zu US-Pendants inzwischen eingeholt haben und gleichzeitig API-Kosten in einem Bruchteil im Vergleich zu amerikanischen Alternativen anbieten, was auf die MoE-Architektur und optimierte Aufmerksamkeitsmechanismen zurückzuführen sei. Der Unternehmens-Output blieb verhalten: Jefferies' LLM Token Expenditure Index lag am 14.–19. Juni bei 1,64–1,68, nach 2,04 am 31. Mai, was darauf hindeutet, dass Entwickler auf günstigere, effizientere Modelle umgestiegen sind.