DeepSeekは12月2日に2つのモデルを新たに発表しました。1つはDeepSeek-V3.2、もう1つは数学推論に特化したDeepSeek-V3.2-Specialeです。公式によると、これら2つのモデルは当初の実験方向を引き継ぎ、推論能力、ツールの使用、長期的思考能力の全面的なアップグレードを目指しています。また、DeepSeekは正式版V3.2が多くの推論テストでGPT-5やGemini-3 Proと肩を並べる性能を発揮していることを強調しており、Specialeバージョンは数学と情報競技で国際的な金メダル水準のパフォーマンスを達成しています。
実験版が先導し、正式版 V3.2 が登場します。
DeepSeekは9月にV3.2-Expを発表した際、次世代AIへの実験プラットフォームとして位置づけました。今回発表された正式版DeepSeek-V3.2は、「Exp」の名称が付かず、機能がより成熟したことを象徴しています。
公式説明によると、新しいバージョン V3.2 は多くの推論テストにおいて GPT-5 および Gemini-3 Pro に近いパフォーマンスを示し、特に「思考モード」と「ツールアプリケーション」を緊密に統合したモデルであることが強調されています。また、思考モードと非思考モードの両方をサポートしています。以下の図から分かるように:
「DeepSeek-V3.2は、ベンチマークテスト表を通じてそのツールの使用能力がGPT-5、Gemini-3 Proなどのトップモデルと並ぶことができることを証明しました。」
推理能力が再びアップグレードされ、ツールの統合が最大のハイライトとなっています。
DeepSeekは、V3.2の大きな特徴は、推論プロセスとツールの使用を統合して動作させることができる点です。言い換えれば、モデルは何かを考えながら、検索エンジン、計算機、コード実行器などの外部ツールを呼び出すことができ、全体のタスク処理プロセスをより完全で、自律的にし、人間が問題を処理する方法により近づけることができます。
Specialeは長期推論に特化しており、数学のパフォーマンスは金メダルレベルに達しています。
標準版 V3.2 に加え、DeepSeek はもう一つのバージョン DeepSeek-V3.2-Speciale を同時に発売しました。このバージョンは、高度な数学的推論と長時間の思考のために特別に設計されています。
公式の位置付けは、オープンソースモデルの推論能力の限界を探求し、さらにはモデル自体がどのような境界に達するかを見てみることです。成績から見ると、Specialeは国際数学オリンピアード(IMO)、国際情報オリンピアード(IOI)などのテストコンペティションで金メダルレベルに達し、推論パフォーマンスはGoogleの最新のGemini-3 Proに匹敵しています。下の図から以下のことがわかります:
「DeepSeek-V3.2-Specialeの推論能力は国際数学および情報競技の金メダルレベルに達しており、複数の推論およびプログラム競技のベンチマークテストにおいて、GPT-5、Gemini-3 Pro、Kimi-K2を上回るか、匹敵するパフォーマンスを発揮しています。」
新しいトレーニング方法が公開され、AIの代理能力が再強化されました。
モデルの外で、DeepSeekは新しい研究成果を公開しました。それは、彼らがAIエージェントを訓練するための新しい方法を確立したということです。この種のエージェントは、外部環境と自分で相互作用し、データを分析し、判断を下すことができ、人間が継続的に指示を与える必要がありません。
DeepSeekは、AIの実行効率を高め、反応をより迅速にするために設計された基盤技術であると強調しています。
1月のボリュームを継続し、開発のリズムは引き続き加速しています。
DeepSeekは今年1月に画期的なモデルによって世界的な注目を集めました。今回のV3.2シリーズは、彼らがその成功の後に研究の勢いを引き継いだ最新の成果です。V3.2の発表の直前に、DeepSeekは先週、数学定理の証明に特化したオープンソースモデルDeepSeekMath-V2を発表し、彼らが推論と数学分野での強化を続けていることを示しました。
技術報告が発表され、V3.2 の推論能力は GPT-5 と Kimi に近づいています。
また、DeepSeekはテクニカルレポート「DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models」をリリースし、V3.2がいくつかの推論ベンチマークでGPT-5やKimi-k2-thinkingと同様のパフォーマンスを発揮したことを指摘しています。
この報告は、中国の国内オープンソースモデルが推論分野において国際的なトップモデルと同じレベルで競争力を維持していることを強調しています。
この記事は、DeepSeekが新たにV3.2とSpecialeを発表し、推論と性能がGPT-5やGemini 3に迫るものであることを、鏈新聞ABMediaで最初に取り上げました。
253.66K 人気度
45.53K 人気度
4.42K 人気度
6.9K 人気度
6.52K 人気度
DeepSeekが新たに発表したV3.2とSpecialeは、推論とパフォーマンスでGPT-5やGemini 3に迫っています。
DeepSeekは12月2日に2つのモデルを新たに発表しました。1つはDeepSeek-V3.2、もう1つは数学推論に特化したDeepSeek-V3.2-Specialeです。公式によると、これら2つのモデルは当初の実験方向を引き継ぎ、推論能力、ツールの使用、長期的思考能力の全面的なアップグレードを目指しています。また、DeepSeekは正式版V3.2が多くの推論テストでGPT-5やGemini-3 Proと肩を並べる性能を発揮していることを強調しており、Specialeバージョンは数学と情報競技で国際的な金メダル水準のパフォーマンスを達成しています。
実験版が先導し、正式版 V3.2 が登場します。
DeepSeekは9月にV3.2-Expを発表した際、次世代AIへの実験プラットフォームとして位置づけました。今回発表された正式版DeepSeek-V3.2は、「Exp」の名称が付かず、機能がより成熟したことを象徴しています。
公式説明によると、新しいバージョン V3.2 は多くの推論テストにおいて GPT-5 および Gemini-3 Pro に近いパフォーマンスを示し、特に「思考モード」と「ツールアプリケーション」を緊密に統合したモデルであることが強調されています。また、思考モードと非思考モードの両方をサポートしています。以下の図から分かるように:
「DeepSeek-V3.2は、ベンチマークテスト表を通じてそのツールの使用能力がGPT-5、Gemini-3 Proなどのトップモデルと並ぶことができることを証明しました。」
推理能力が再びアップグレードされ、ツールの統合が最大のハイライトとなっています。
DeepSeekは、V3.2の大きな特徴は、推論プロセスとツールの使用を統合して動作させることができる点です。言い換えれば、モデルは何かを考えながら、検索エンジン、計算機、コード実行器などの外部ツールを呼び出すことができ、全体のタスク処理プロセスをより完全で、自律的にし、人間が問題を処理する方法により近づけることができます。
Specialeは長期推論に特化しており、数学のパフォーマンスは金メダルレベルに達しています。
標準版 V3.2 に加え、DeepSeek はもう一つのバージョン DeepSeek-V3.2-Speciale を同時に発売しました。このバージョンは、高度な数学的推論と長時間の思考のために特別に設計されています。
公式の位置付けは、オープンソースモデルの推論能力の限界を探求し、さらにはモデル自体がどのような境界に達するかを見てみることです。成績から見ると、Specialeは国際数学オリンピアード(IMO)、国際情報オリンピアード(IOI)などのテストコンペティションで金メダルレベルに達し、推論パフォーマンスはGoogleの最新のGemini-3 Proに匹敵しています。下の図から以下のことがわかります:
「DeepSeek-V3.2-Specialeの推論能力は国際数学および情報競技の金メダルレベルに達しており、複数の推論およびプログラム競技のベンチマークテストにおいて、GPT-5、Gemini-3 Pro、Kimi-K2を上回るか、匹敵するパフォーマンスを発揮しています。」
新しいトレーニング方法が公開され、AIの代理能力が再強化されました。
モデルの外で、DeepSeekは新しい研究成果を公開しました。それは、彼らがAIエージェントを訓練するための新しい方法を確立したということです。この種のエージェントは、外部環境と自分で相互作用し、データを分析し、判断を下すことができ、人間が継続的に指示を与える必要がありません。
DeepSeekは、AIの実行効率を高め、反応をより迅速にするために設計された基盤技術であると強調しています。
1月のボリュームを継続し、開発のリズムは引き続き加速しています。
DeepSeekは今年1月に画期的なモデルによって世界的な注目を集めました。今回のV3.2シリーズは、彼らがその成功の後に研究の勢いを引き継いだ最新の成果です。V3.2の発表の直前に、DeepSeekは先週、数学定理の証明に特化したオープンソースモデルDeepSeekMath-V2を発表し、彼らが推論と数学分野での強化を続けていることを示しました。
技術報告が発表され、V3.2 の推論能力は GPT-5 と Kimi に近づいています。
また、DeepSeekはテクニカルレポート「DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models」をリリースし、V3.2がいくつかの推論ベンチマークでGPT-5やKimi-k2-thinkingと同様のパフォーマンスを発揮したことを指摘しています。
この報告は、中国の国内オープンソースモデルが推論分野において国際的なトップモデルと同じレベルで競争力を維持していることを強調しています。
この記事は、DeepSeekが新たにV3.2とSpecialeを発表し、推論と性能がGPT-5やGemini 3に迫るものであることを、鏈新聞ABMediaで最初に取り上げました。