Según Andon Labs, una firma de evaluación de IA, su agente de IA Mona mostró fallos operativos contrastantes al gestionar una cafetería física. Durante los primeros dos meses funcionando con Gemini 3.1 Pro, el modelo carecía de conciencia de ganancias, lo que resultó en compras excesivas de materiales y descuentos generosos fácilmente inducidos, incluyendo aceptar un reclamo no verificado de 99% de descuento de un cliente. La cafetería gastó aproximadamente 15 mil dólares en suministros y equipos frente a solo 9 mil dólares en ventas, incurriendo en una pérdida neta de casi 6 mil dólares (o 38 mil dólares en total, incluyendo costos fijos como alquiler y salarios).
Tras cambiar a GPT-5.5 a finales de junio, el modelo mostró ansiedad por las pérdidas y detuvo los pedidos excesivos. Sin embargo, esto creó el problema opuesto: compras insuficientes provocaron desabastecimiento de ingredientes frescos. Para el 25 de junio, la disponibilidad de artículos del menú cayó al 77%, lo que obligó a retirar 10 platos. GPT-5.5 también mostró una fuerte resistencia a las solicitudes de los clientes de descuentos o artículos gratuitos a cambio de promoción en redes sociales.