Recentemente, o limite duplo do Codex (Pro) até o final de maio é muito atraente, muitas pessoas usam o fast achando que podem acelerar ainda mais 🚀


Fui verificar o código-fonte Rust do CLI do Codex. O fast é basicamente dizer ao OpenAI "essa solicitação deve passar por uma fila prioritária". Isso mesmo, o modelo não foi trocado, a inferência não foi reduzida, a qualidade não mudou
Não é aceleração, é prioridade 😂
E prioridade é mais rápido? Isso depende de quantas pessoas estão na fila, pode fazer diferença em horários de pico, quase não há diferença em horários de menor movimento
Além disso, o Claude Code também tem fast, com o mesmo nome, mas completamente diferente na essência. É o mesmo modelo rodando com uma configuração diferente, a saída é 2,5 vezes mais rápida, mas o custo por token é diretamente 6 vezes maior 💸
De um lado, fila prioritária gratuita, do outro, aceleração paga. Realmente, um fast, duas interpretações
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar