Laut CNBC haben diese Woche KI-Führungskräfte, darunter Cognition-CEO Scott Wu und Cisco-CPO Jeetu Patel, enthüllt, dass das Model Routing – eine Lösung, die Aufgaben anhand ihrer Komplexität den passenden KI-Modellen zuordnet – zu einer zentralen Kostendisziplin in der Unternehmenswelt wird.
Derzeit entfallen laut Glean-CEO Arvind Jain rund 95% der unternehmensweiten KI-Nutzung auf teure Frontier-Modelle, selbst für Routineaufgaben. Model Routing könnte bei Boilerplate-Arbeit eine 5- bis 10-mal bessere Kosteneffizienz ermöglichen, indem günstigere Alternativen zum Einsatz kommen. Ciscos Kostenanalyse unterstreicht den Druck: Bei 200 US-Dollar Token-Nutzung pro Mitarbeiter wöchentlich steht das Unternehmen für seine 90.000 Mitarbeitenden vor einem jährlichen KI-Aufwand von rund 900 Millionen US-Dollar. Wenn Unternehmen zunehmend High-Volume- und einfache Aufgaben an günstigere oder Open-Source-Modelle weiterleiten, würden OpenAI und Anthropic nur noch für komplexe Arbeit bezahlt werden – was die Preismodelle beider Unternehmen potenziell neu ausrichten könnte, auf denen ihre Bewertungen aufgebaut sind.