DeepSeek und die Peking-Universität veröffentlichen am 27. Juni ein DSpark-Papier, mit Gründer Liang Wenfeng als Autor.

Laut Guru Club veröffentlichten das Team von DeepSeek und die Peking-Universität am 27. Juni ein Forschungspapier mit dem Titel „DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation“. Das Papier stellt ein spekulatives Dekodierungsmodul vor, um die Inferenzleistung der bestehenden Modelle DeepSeek-V4-Pro und DeepSeek-V4-Flash zu optimieren. Gleichzeitig stellte das Team unter der MIT-Lizenz DeepSpec als Full-Stack-Codebasis für das Training und die Evaluierung von spekulativen Dekodierungs-Entwurfsmodellen als Open Source zur Verfügung. DeepSpec unterstützt derzeit drei Implementierungen: DSpark, DFlash und Eagle3. Bemerkenswerterweise ist DeepSeek-Gründer Liang Wenfeng als Autor des Papiers aufgeführt.
Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
ManeyToFuturevip
· 1Std her
LFG 🔥
Antworten0