ゲートニュース速報、4月24日—DeepSeekは、MITライセンスのもとでオープンソースのV4シリーズモデルをリリースしました。重みは現在Hugging FaceおよびModelScopeで利用可能です。このシリーズには2つのモーダル・エキスパート (MoE)モデルが含まれています。V4-Proは総パラメータ1.6兆で、1トークンあたり490億が有効化され、V4-Flashは総パラメータ2840億で、1トークンあたり130億が有効化されます。両方とも1,000,000トークンのコンテキストウィンドウをサポートします。
アーキテクチャには3つの重要なアップグレードがあります。圧縮されたスパース注意 (CSA) と大幅に圧縮された注意 (HCA) を組み合わせたハイブリッド注意メカニズムにより、ロングコンテキストのオーバーヘッドを大幅に削減—V4-Proの1Mコンテキストにおける推論FLOPsはV3.2のわずか27%であり、推論中に歴史情報を格納するためのKVキャッシュ (VRAM) はV3.2の10%にとどまります。従来の残差接続に代わり、層間の信号伝播の安定性を高めるマニフォールド制約付きハイパーコネクション (mHC)。そして、より速い学習収束のためのMuonオプティマイザです。事前学習では32兆トークン以上のデータを使用しました。
事後学習は2段階のアプローチを採用します。まず、教師あり微調整 (SFT) とGRPO強化学習によりドメイン固有のエキスパートを訓練し、その後オンライン蒸留によってそれらを単一モデルに統合します。V4-Pro-Max (最高推論モード)は、トップクラスのコーディングベンチマークを備え、推論およびエージェントタスクにおけるクローズドソースのフロンティアモデルとのギャップを大幅に縮めた、最強のオープンソースモデルであると主張しています。V4-Flash-Maxは、十分な計算予算がある場合にProレベルの推論性能を実現しますが、純粋な知識および複雑なエージェントタスクにおいてはパラメータ規模によって制約を受けます。重みは混合精度のFP4+FP8で保存されます。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
OpenAIエンジニアのクライブ・チャンが、V3との比較で誤りと曖昧さを挙げてV4のハードウェア推奨を問題視
ゲート・ニュース 4月24日 — OpenAIのエンジニア、クライブ・チャン(Clive Chan)は、V4の技術レポートにおけるハードウェア推奨章に対して、詳細な異議を提起した。称賛されるV3版と比べて「驚くほど出来が悪く、エラーが起きやすい」と述べている。V3のハードウェア指針には、Q&Aセッションが含まれており
GateNews29分前
ネイバー、AI Tabベータを開始 GoogleのGeminiが韓国の検索市場に参入
ゲートニュース、4月24日 — ネイバーは、新しい会話型検索機能「AI Tab」のクローズドベータ開始を発表しました。これは、韓国でGoogleがChromeにGeminiを導入したことを受けてのものです。
AI Tabは、ネイバーの既存の検索タブと並んで表示され、ユーザーに会話によるクエリ専用のスペースを提供します。
GateNews41分前
インドでAIエンジニア採用が59.5%急増、テック拠点の外へ拡大
LinkedInのAI労働市場レポート2026は4月24日にリリースされ、インドでのAIエンジニアリング採用が前年比59.5%増加したことを明らかにしました。同プラットフォームが調査した市場の中で最速のペースを示しています。
成長は、需要が確立されたテック拠点の外へ広がったことによってもたらされました。都市としては、これらを含みます。
CryptoFrontier1時間前
コモンウェルス銀行、AI拡大を背景に120人の雇用を削減
オーストラリア連邦銀行(Commonwealth Bank of Australia)は、ブルームバーグによると、同国最大手の銀行が職務を見直し、人工知能(AI)の利用を拡大するのに伴い、約120人の雇用を削減すると発表した。削減には、西オーストラリア州のバンクウェスト(Bankwest)での43の職務が含まれており、自動化によって6つのポジションが影響を受ける。これはこれまでの
CryptoFrontier1時間前
Cursor が XAI 訓練を停止した理由:計算能力が詰まっているため、SpaceX は別途 600 億ドルの買収オプションを確保
Anysphere は、Cursor が xAI とともに Colossus 基盤インフラを用いて新しいモデルを訓練し、計算能力のボトルネックを突破すると発表しました。SpaceX は 600 億ドルの買収オプション(2026 年以内に全体買収が可能)を提示し、もし買収できない場合は、協力の補償として約 100 億ドルを支払います。2 件の取引は同時に進行しており、誰が Cursor を訓練できるのか、そして誰が Cursor を買い取れるのかを再定義します。Cursor は引き続き多くのモデルのバックエンドを許可しますが、長期的には SpaceX が買収権を行使するかどうかで決まります。
ChainNewsAbmedia1時間前
Anthropic 二次市場の評価額が1兆ドルを突破:Forge Global が OpenAI の 8,800 億を逆転
Decryptの報道によると、Forge GlobalのAnthropicの二次評価額は約1兆ドル、OpenAIは約8,800億ドルで、二次市場で初めて主導権の逆転が起きた。AnthropicのARRは2025年末の約90億から2026年3月の約300億へと増加し、3か月で233%成長して、プライベート市場の評価額を押し上げた。二次評価額は一次調達とは異なり、出口に対する信頼を反映している。今後も技術、政策、ビジネス、そしてナラティブの4つのレーンを見ていく。
ChainNewsAbmedia1時間前