ตาม BlockBeats Brian Armstrong ซีอีโอของ Coinbase กล่าวเมื่อวันที่ 27 มิถุนายนว่ากุญแจสำคัญในการรักษาต้นทุน AI ให้คงที่ในขณะที่การใช้งานโทเค็นเติบโตแบบทวีคูณไม่ใช่การจำกัดการใช้งาน แต่เป็นการใช้โมเดลเริ่มต้นที่ดีกว่าและกลไกการแคช Coinbase กำลังตั้งค่าเริ่มต้นเป็นโมเดลโอเพนเวท เช่น GLM 5.2 และ Kimi 2.7 ผ่าน LLM gateway ของตน ในขณะเดียวกันก็ยังสนับสนุนให้วิศวกรเลือกโมเดลที่เหมาะสมสำหรับงานเฉพาะทาง บริษัทระบุว่าพนักงาน 91% ไม่เคยถึงขีดจำกัดการใช้งาน ดังนั้นแทนที่จะลดโควตา กลับเปลี่ยนเป็นโมเดลเริ่มต้นที่มีต้นทุนต่ำกว่า
Coinbase ได้นำการจัดการคำขอที่คำนึงถึงแคชและการกำหนดเส้นทางโมเดลอัจฉริยะตามอัตราการชนแคชมาใช้ ตัวอย่างเช่น หลังจากปรับปรุงการใช้งานแคช อัตราการชนแคชของ LibreChat เพิ่มขึ้นจาก 5% เป็น 60% ผ่านแนวทางเหล่านี้ Coinbase ลดค่าใช้จ่ายด้าน AI ลงเกือบครึ่งหนึ่งในขณะที่การใช้โทเค็นยังคงเติบโตอย่างต่อเนื่อง