Selon Andon Labs, une société d'évaluation en IA, leur agent IA Mona a montré des échecs opérationnels contrastés lors de la gestion d'un café physique. Au cours des deux premiers mois d'exploitation avec Gemini 3.1 Pro, le modèle manquait de conscience des profits, entraînant des achats excessifs de matériel et des remises importantes facilement accordées — y compris l'acceptation d'une demande de réduction non vérifiée de 99% de la part d'un client. Le café a dépensé environ 15 000 $ en fournitures et équipements contre seulement 9 000 $ de ventes, subissant une perte nette de près de 6 000 $ (ou 38 000 $ au total, y compris les coûts fixes comme le loyer et les salaires).
Après être passé à GPT-5.5 fin juin, le modèle a montré une anxiété face aux pertes et a cessé de commander en excès. Cependant, cela a créé le problème inverse : des achats insuffisants ont conduit à des ruptures de stock d'ingrédients frais. Au 25 juin, la disponibilité des articles du menu est tombée à 77%, forçant le retrait de 10 plats. GPT-5.5 a également montré une forte résistance aux demandes de clients pour des réductions ou des articles gratuits en échange de promotion sur les réseaux sociaux.