Suchergebnisse für "DEEPSEEK"
Heute
04:17

Die Nvidia-Blackwell-GPUs kosten das Doppelte, aber die Ausgaben für die Inferenz pro Token sinken um das 35-Fache im Vergleich zu Hopper

Laut Nvidias neuester Blog-Analyse kosten Blackwell-GPUs pro Stunde nahezu das Doppelte im Vergleich zur Hopper-Generation, liefern jedoch 35-mal niedrigere Inferenz-Kosten pro Token. Mit DeepSeek-R1 als Testmodell mietet Blackwell (GB300 NVL72) für 2,65 US-Dollar pro GPU und Stunde anstelle von 1,41 US-Dollar bei Hopper, aber mit einer einzelnen GPU
Mehr
13:41

Alibaba Cloud senkt die Preisgestaltung für den impliziten Cache von DeepSeek-V4-Pro auf 1 Yuan pro Million Tokens am 29. April

Laut Alibaba Cloud wird die Bailian-Plattform die Preisgestaltung für den impliziten Cache des DeepSeek-V4-Pro-Modells (Impliziter Cache) auf 1 Yuan pro Million Tokens senken, wirksam ab dem 29. April 2026 um 23:59:59 Pekinger Zeit. Der implizite Cache gilt nur, wenn Anfragen den Cache treffen; die abgerechneten Tokens für zwischengespeicherte Eingaben werden zum cached_token-Satz berechnet, während nicht zwischengespeicherte Eingabetokens zum standard input_token-Satz abgerechnet werden. Die Anpassung betrifft ausschließlich die Preisgestaltung des impliziten Caches; die Basis-Modell-Inferenzraten bleiben unverändert.
09:09

DeepSeek-Multimodal-Forscher deutet neues Vision-Modell am 29. April an

Am 29. April hat ein Forscher aus dem DeepSeek-Multimodal-Team, Xiaokang Chen, auf X gepostet: „Jetzt sehen wir dich“, begleitet von zwei Bildern des DeepSeek-Wal-Maskottchens – eines mit geschlossenen Augen und das andere mit offenen Augen. Der Beitrag scheint auf ein bevorstehendes Vision-Modell hinzuweisen und passt damit zu Chens Rolle als Forscher im DeepSeek-Multimodal-Team. Dee
Mehr
06:31

DeepSeek senkt die Preise für V4-Pro um 75% und kappen die API-Cache-Kosten auf ein Zehntel

Gate News-Meldung, 27. April — DeepSeek hat für sein neues V4-Pro-Modell eine 75%ige Ermäßigung für Entwickler angekündigt und die Preise für Input-Cache-Treffer über seine gesamte API-Produktlinie auf ein Zehntel der bisherigen Werte gesenkt. Das V4-Modell, das am 25. April in den Pro- und Flash-Versionen veröffentlicht wurde, wurde für die Ascend-Prozessoren von Huawei optimiert
Mehr