報道によると、NVIDIAとMITの研究者はLightning OPD(Offline On-Policy Distillation)をリリースした。これは、大規模言語モデル向けの新しいポストトレーニングの枠組みであり、学習中に教師モデルを常に稼働させ続ける必要をなくす。教師モデルの対数確率を事前にオフラインで計算しておくことで、この枠組みは学習効率を4倍に向上させ、同時にGPUリソースをすべて学生モデルの学習に割り当てられるようにする。
8基のNVIDIA H100 GPUでのテストでは、Lightning OPDはQwen3-30B-A3B-Base(パラメータ300億のMoEモデル)を正常に蒸留し、AIME 2024ベンチマークで71.0を達成した。これに対し、標準のOPDは同じハードウェア上でメモリ不足になった。より小型のQwen3-8Bモデルでは、この枠組みに69.9ポイントに到達するためのGPU時間としてわずか30時間しか必要としなかった。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
米国と中国が新たなAI安全対話を準備、AnthropicのMythosモデルが協議を促進
Beating(監視プラットフォーム)によると、中国と米国はAI安全性に関する新たな対話ラウンドを開始する準備を進めている。きっかけとなっているのはAnthropicのMythosモデルで、政府のデータベースや病院ネットワークに自律的に侵入できるため、米国当局はそれを前例のないサイバー兵器だとみなしている。同時に、DeepSeekは自社の新モデルがHuaweiのチップに合わせて改良されたと発表しており、これにより中国のNvidiaへの依存度が下がり、交渉上の立場が強まっている。米国の上級当局者は、ホワイトハウスが近日予定されている中米首脳級会談の場で意思疎通のための連絡経路を開くことを目指していることを確認した。
GateNews5分前
ライツスピード、インド・ファンドの目標を3億ドル〜3.5億ドルに引き下げ、AIへ重点を移す
米国拠点のベンチャーキャピタル企業Lightspeedは、The Economic Timesによると、インドに焦点を当てた5本目のファンドの目標額を、最大で$500 millionから$300 million〜$350 millionに引き下げた。同社は、アーリー段階のAIおよびディープテック投資へ重点を移している。 戦略の転換とファンド規模 今回のファンド減額は、Lightspeedのそれ以前のインド向けファンド規模への回帰を意味する。新たな目標は、同社の最初の3つのインド向けファンドにより近い。これらはそれぞれ$135 million、$180 million、$275 millionの規模だった。規模を縮小した資金プールは、初期段階への投資アプローチに合致しており、ベンチャーキャピタル企業は通常、より多くの企業に投資し、当初の投資額はより小さな小口で行う。 Lightspeedの前回のインドおよび東南アジアファンド(Fund IV)は、2022年に$500 millionを調達しており、同社のインドでの資金調達が最も大きかった局面を示している。 ポートフォリオの背景 この見直し
CryptoFrontier11分前
黄仁勳は最後の瞬間にトランプの中国訪問に招かれ、空軍一号に搭乗した
白宮は、輝達の最高経営責任者(CEO)である黄仁勳が、最後の最後で米国大統領のトランプが行う対中訪問(川習会)の日程に招待されたことを確認した。先に、複数の情報筋が彼は名簿に入っていないと伝えていたにもかかわらず、目撃者の投稿によれば、現在のところ黄仁勳はアラスカで空軍一号に搭乗し、テスラのCEOであるマスクなど複数の企業トップとともに中国を訪問しているという。 川習会で訪中する代表団の名簿に、なぜドラマチックな変化が起きたのか? メディアが引用した情報筋によると、輝達のCEOである黄仁勳は当初、トランプが中国を訪問する際の企業トップの招待リストには入っていなかった。米東部時間の火曜深夜になっても、関連する訪問名簿には黄仁勳は含まれておらず、外界では一時、このAI分野のトップである彼は今回の外交日程には欠席すると広く見られていた。しかし状況は短時間で変わり、ブルームバーグ・ニュースは、黄仁勳が日程開始後の「最後の1分」で臨時に訪問団メンバーとして追加されたと指摘した。ホワイトハウスの広報コミュニケーション担当の連絡主任、スティーブン・チェン(Steven Cheung)は、この変更につ
ChainNewsAbmedia28分前
マイケル・バリー警告:AI株の相場は1999年から2000年のバブルと似ていて、最後の数カ月
投資百科(Investopedia)が 5 月 12 日に報じたところによると、2008 年の不動産市場の崩壊を予測したことで知られる投資家 Michael Burry は週末に Substack へ複数の記事を投稿し、最近の AI 関連株の上昇相場について「1999-2000 年のバブルの最後の数カ月のような感じだ」と述べ、「放物線のように上昇している株を減らす」ことを勧めた。 Burry の具体的な警告と行動提案 Investopedia の報道によれば、Burry は日曜の Substack 記事で投資家に対し、「現時点では、買い看るオプション(プット)のコストが一般に非常に高く、株を直接空売りすると重大な損失につながる可能性がある」と警告した。彼は空売りではなく、保有比率の引き下げや上昇している株の売却によってリスクを下げることを勧めた。 Burry は記事の中で、「株式市場の上げ下げは、雇用や消費者の信頼とは関係がない。これらがずっと上がり続けているのは、以前からずっと上がっていたからだ。そして、すべては誰もが自分は理解していると思い込める単純な理屈に基づいている」と述べてい
MarketWhisper38分前
5月末までに、日本のメガバンク3行がAnthropicのClaude Mythosへのアクセスを得る見通し
日経によると、日本の3大銀行は、米国のスタートアップAnthropicが開発した強力な人工知能モデル「Claude Mythos」に、5月末までにアクセスできる見通しだ。
GateNews39分前
AIパッケージのサプライチェーンが二重攻撃:Mistralと偽のOpenAIモデルが共に侵入される
AI 開発者ツールのエコシステム——5月12日に同日に報じられた2件の重大なサプライチェーン攻撃:(1)Microsoft Threat Intelligence が Mistral AI の PyPI パッケージに悪意のあるコードが仕込まれていたことを開示;(2)偽の OpenAI を名乗る Hugging Face のモデルプロジェクトがトレンド1位に駆け上がり、18時間以内に24.4万回のダウンロードを集め、大量のアカウント情報とパスワードを窃取した。Decrypt の報道によれば、2件の出来事はいずれも、AI 開発者エコシステムがサプライチェーンへの侵入に対して脆弱であることを露呈した。 目次 切り替え Mistral AI パッケージ事案:Hugging Face Transformers の名称を装った二段階攻撃 偽 OpenAI Hugging Face 案:6段階の Rust で書かれた infostealer 産業的な意味:AI サプライチェーンが新たな攻撃面に Mistral AI パッケージ事案:Hugging Face Transformers の名称を装った二
ChainNewsAbmedia1時間前