Bezahlen mit

USD

Supports Visa, Mastercard, SEPA & more

Flexible trading, zero fees

Use your crypto for payments worldwide

Basic

Krypto frei handeln

Steigern Sie Ihren Gewinn durch Leverage

Convert & Auto-Invest

Trade any size with no fees and no slippage

Unkomplizierte Beteiligung an Positionen mit Hebelwirkung

Pre-Market Trading

Trade new tokens before listing

Advanced

Trade on-chain with Gate Wallet

Smart access to new on-chain tokens

Smart strategies with automated trading

Follow expert trading strategies

CrossEx Trading

One margin balance, shared across platforms

Access hundreds of perpetual contracts

One platform for global traditional assets

Mit Vanilla-Optionen im europäischen Stil handeln

Einheitliches Konto

Maximieren Sie Ihre Kapitaleffizienz

Einführung in den Futures-Handel

Bereiten Sie sich auf Ihren Futures-Handel vor

Join events to earn rewards

Nutzen Sie virtuelle Gelder um risikofreien Handel zu erleben

U.S. stock CFD derivatives

Access real US stocks and ETFs

Trade quality Hong Kong-listed stocks

negociação 24/7

Tokenized Stocks

Backed by real stock assets

Unlock full access to global stock IPOs

Mint GUSD for Treasury RWA yields

Stocks Activities

Trade Popular Stocks and Unlock Generous Airdrops

Launch

Sammle Süßigkeiten, um Airdrops zu erhalten

Schnelles Staking, verdienen Sie potenziell neue Token

Halten Sie GT und erhalten Sie kostenlos massive Airdrops

Unlock full access to global stock IPOs

Trade on-chain assets and earn airdrops

Guadagna punti Futures e richiedi le ricompene dell'airdrop

Investition

Earn interest with idle tokens

Automatisches Investieren

Investieren Sie regelmäßig automatisch

Dual Investment

Profit from market volatility

Sanftes Staking

Verdienen Sie Belohnungen mit flexiblem Staking

Krypto - Anleihe

Verpfänden Sie eine Kryptowährung, um eine andere auszuleihen

One-Stop-Lending-Hub

Premium wealth growth plans

Private Wealth Management

Premium asset allocation

Top-tier quant strategies

Kryptowährungen einsetzen, um an PoS Produkten zu verdienen

No-liquidation leverage

USD1 Soft-Staking

No lock-up, withdraw anytime

Post, share, and explore crypto trends

Live-Krypto-Marktanalyse

Mit Krypto-Tradern chatten

Aktuelles aus dem Krypto-Bereich

Mehr

Werbeaktionen

Activity Center

Participate in activities to earn rewards

Invite friends to earn referral rewards

Affiliate Program

Earn exclusive commission rewards

Grow influence and earn airdrops

Real-time platform updates

Artikel zur Kryptobranche

Große Rabatte auf Gebühren

Asset Management

All-in-One-Lösung für die Verwaltung Ihrer Vermögenswerte

Enterprise digital asset solutions

Developers (API)

Connects to the Gate application ecosystem

OTC-Banküberweisung

Fiat einzahlen und abheben

Attraktive API-Rabattmechanismen

AI

Your all-in-one conversational AI partner

Use Gate AI directly in your social App

Gate Blue Lobster, ready to go

Gate for AI Agent

Gate Skills Hub

10K+ Fähigkeiten

From office tasks to trading, the all-in-one skill hub makes AI even more useful.

Andere

Finden Sie FAQs und Hilfeanleitungen

Erfahren Sie mehr über Krypto-Investitionen

Wachsen Sie mit den Champions

Reserven-Nachweis

Gate verspricht einen 100%igen Nachweis der Reserven

Halten Sie Ihre Vermögenswerte sicher

DeepSeek: Trainingsdaten für V4 auf 33T verdoppelt, Instabilität ausgelöst, die die Veröffentlichung verzögerte

AI Industry News

2026-04-24 03:21:29

Gate News-Mitteilung, 24. April — Der technische Bericht von DeepSeek über V4 zeigt, dass V4-Flash und V4-Pro jeweils auf 32T- bzw. 33T-Token vortrainiert wurden, also doppelt so viele wie die ungefähr 15T-Token, die für V3 verwendet wurden. Der Bericht räumt ein, dass es während des Trainings zu „erheblichen Instabilitätsproblemen“ kam, wobei es wiederholt zu Verlust-Spikes kam, die auf Anomalien in der Mixture-of-Experts (MoE)-Schicht zurückzuführen sind; der Routing-Mechanismus selbst verschärft diese Anomalien, und ein simples Rollback kann das Problem nicht beheben.

DeepSeek hat jetzt zwei Lösungen implementiert, die im tatsächlichen Training eingesetzt werden: Antizipatives Routing, das die Berechnung des Routing-Index von Updates des Backbone-Netzwerks entkoppelt und automatisch nur dann auslöst, wenn Verlust-Spikes erkannt werden (wobei ein zusätzlicher Overhead von etwa 20% entsteht), sowie SwiGLU-Clamping, das Anomalien direkt unterdrückt, indem Aktivierungswerte auf einen festen Wertebereich eingeklemmt werden. Der Bericht besagt, dass beide Ansätze wirksam sind, räumt jedoch ein: „Die zugrunde liegenden Prinzipien sind weiterhin nicht ausreichend verstanden.“

Susan Zhang, eine Forscherin bei Google DeepMind, die zuvor bei Meta AI und OpenAI gearbeitet hat, kommentierte, dass die Instabilität, die durch das Verdoppeln der Trainingsdaten ausgelöst wurde, „die Verzögerung erklärt.“ Sie bezeichnete die beiden Lösungen als „Pflaster“, während sie zugleich anerkennt, wie transparent DeepSeek technisch ist.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.

Related News

DeepSeek veröffentlicht die V4-Open-Source-Modellserie mit 1,6T Parametern und MIT-Lizenz

OpenAI bringt GPT-5.5 auf den Markt, entwickelt für Agentenaufgaben und komplexe Workflows

Vercel-Sicherheitsverletzung weitet sich auf Hunderte Nutzer aus; KI-Entwickler stärker gefährdet

Cluster Protocol sammelt $5M in der Finanzierung ein, DAO5 führt die Runde an

DeepSeek stellt TileKernels Open Source: GPU-Kernel-Bibliothek für das Training und die Inferenz großer Modelle

In-Depth Analysis

J.P. Morgan: KelpDAO-Sicherheitslücke löscht 20 Milliarden DeFi TVL, institutionelle Attraktivität beeinträchtigt

Market Whisper04-24 02:50

Extremer Schrecken um 23 — Aber KI-Coins drucken grün: 4 Krypto-Tipps, bei denen Smart Money still und leise ansammelt

Crypto News Land04-24 01:31

JPMorgan: DeFi-Hacker werden immer häufiger und das Interesse an Kompressionsmechanismen, die das TVL stagnieren lassen, wächst – Kapital wechselt zu USDT

ChainNewsAbmedia04-23 15:24

Kommentieren

0/400

Keine Kommentare