A DeepSeek implementou o seu framework de aceleração de amostragem especulativa DSpark para os serviços de produção do DeepSeek-V4, na sequência de um relatório técnico conjunto com a Universidade de Pequim. O DSpark aumenta a velocidade de geração em 60% a 85% para a versão Flash e 57% a 78% para a versão Pro, sem comprometer a qualidade do resultado.
A DeepSeek disponibilizou em código aberto a base de código completa do DeepSpec, juntamente com o framework. O DeepSpec suporta modelos populares de código aberto, incluindo Qwen3 e Gemma, fornecendo aos programadores um conjunto completo de ferramentas Python para treinar módulos de aceleração personalizados localmente.