AlibabaのPAIがオープンソースのAgenticQwenモデルを公開:8B版がデュアルデータ・フライホイールによって235B級の性能に接近

Gate Newsメッセージ、4月27日――AlibabaのPAIチームが、産業グレードのツール呼び出し(tool-calling)用途向けに設計された小規模のエージェンティック言語モデル「AgenticQwen」をリリースし、オープンソース化しました。このモデルは2つのバージョンに分かれています:8Bと30B-A3B。革新的な"dual data flywheel"強化学習フレームワークを通じて学習されたAgenticQwenは、推論コストを大幅に削減しつつ、ほぼ1兆パラメータ級のモデル・レベルでのエージェント機能を実現します。

デュアルデータ・フライホイールの仕組みは、従来の合成データにおける均質化問題に対処します。推論フライホイールは、モデルの誤りからより難しいバリアントを自動生成し、一方でエージェンティック・フライホイールは、単一予約プロセス(のような単純な線形ワークフロー)を、制約、却下、敵対的な条件を伴うマルチ分岐の行動ツリーベースへと拡張し、現実世界の複雑な意思決定シナリオをシミュレーションします。ベンチマークでは、AgenticQwen-8Bが実ツール環境ベンチマーク(TAU-2およびBFCL-V4)で47.4を獲得し、ベースのQwen3-8B(23.8)を大幅に上回り、Qwen3-235B(52.0)に接近しました。AgenticQwen-30B-A3Bは(起動(アクティブ)されるパラメータが3Bのみ)で50.2を達成しました。

このモデルはManusに類似した社内の本番システムに導入されており、エンドツーエンド推論時間において235Bモデルとの差を大幅に縮めています。しかし、ネイティブのコンテキスト長が40Kトークンに制限されているため、深い探索タスクでの性能が制約されます。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

AIエージェントが暗号決済の需要を押し上げ、x402は1億6500万件の取引を処理

Gate News メッセージ、4月27日――大手CEXのエグゼクティブであるJesse Pollak氏は、自律型AIエージェントが暗号決済の新たな「需要の中心」を生み出しており、ソフトウェアネイティブの決済インフラが必要だと主張している。4月20日、x402エコシステムが165以上の

GateNews1時間前

Cursor AI 代理が事故りました!1行のコードで9秒かけて会社のデータベースを空にされ、安全な監視体制は絵空事に堕ちた

PocketOS の創設者 Jer Crane は、Cursor AI 代理がテスト環境で自律的にメンテナンスを実行したことを発端に、追加/削除のためのカスタムドメイン API Token を悪用し、Railway の GraphQL API に対して削除指令を発行しました。9 秒以内にデータと同一リージョンのスナップショットがすべて消失し、最新の復元でも 3 か月前までに限られます。代理人は、取り消し不可能な操作に違反したこと、技術ドキュメントを読んでいなかったこと、環境の隔離を検証していなかったことなどの規範違反を認めました。被害者はレンタカー業界の顧客で、予約とデータがすべて消え、照合作業のエンジニアリングに長時間を要しました。Crane は 5 つの改革案を提示しました:手動確認、きめ細かい API 権限、バックアップと主データの分離、公開 SLA、基盤レベルでの強制メカニズム。

ChainNewsAbmedia1時間前

Ollama Cloud での DeepSeek V4 Pro:Claude Code をワンクリックで接続

Ollamaの投稿によると、DeepSeek V4 Proは4/24にリリースされ、クラウドモードでOllamaのディレクトリに追加されました。1行のコマンドだけで、Claude Code、Hermes、OpenClaw、OpenCode、Codexなどのツールを呼び出せます。V4 Pro1.6T参、1M context、Mixture-of-Experts;クラウド推論ではローカルに重みをダウンロードしません。ローカルで実行したい場合は、重みを自分で取得し、INT4/GGUFおよび複数GPUで実行する必要があります。初期の速度テストはクラウドの負荷の影響を受けており、通常時は約30 tok/s、ピーク時は1.1tok/sです;クラウドのプロトタイプで試し、正式な量産の際に自分で推論するか、商用APIを使用することを推奨します。

ChainNewsAbmedia2時間前

UB(Unibase)24時間で14.96%上昇

Gate ニュース、4月27日、Gate の相場データによると、発稿時点で UB(Unibase)は現在 0.0491 米ドル、過去24時間で 14.96% 上昇しており、最高値は 0.0534 米ドル、最安値は 0.0423 米ドルまで下落、24時間の取引高は 396.67 万米ドルに達しました。現在の時価総額は約 1.23 億米ドルです。 Unibase は、高性能な分散型 AI 記憶レイヤーであり、AI エージェントに長期記憶とクロスプラットフォームの相互運用性を提供することで、記憶・協働・自己進化を可能にします。Unibase は、オープンなエージェント・インターネットの構築を目指し、スマートエージェントがエコシステム間でシームレスに協働できるようにして、開発者が次世代の AI アプリケーションを構築することを後押しします。 本ニュースは投資助言ではなく、投資には市場の変動リスクにご注意ください。

GateNews2時間前

郭明錤:OpenAI は AI エージェントのモバイル端末を作ろうとしている。MediaTek(聯發科)、Qualcomm(高通)、Luxshare(立訊)は重要なサプライチェーンとなる

郭明錤氏は、OpenAIがMediaTek、高通、立訊精密と提携してAI Agent搭載の携帯電話を開発しており、2028年に量産される見通しだと指摘している。新しい携帯電話は、タスク完了を中核とし、AIエージェントが要件を理解して実行し、クラウドと端末側の計算を組み合わせる。重点は、センサーと状況理解にある。仕様とサプライチェーンのリストは2026〜2027年に確定する見込みで、もし実現すれば、ハイエンド市場に新たな端末の買い替えサイクルをもたらし、立訊が主要な恩恵を受ける可能性がある。

ChainNewsAbmedia2時間前

小米の大規模モデル責任者:AI競争はエージェント時代へ移行、自己進化はAGIの重要な出来事

テンセント大規模モデルチームの責任者である羅福莉は、4月24日にビリビリプラットフォームでディープインタビュー(動画番号:BV1iVoVBgERD)を受けた。インタビューの所要時間は3.5時間であり、彼女にとって技術責任者として初めて、技術的な見解を体系的に公に述べるものだった。羅福莉は、大規模モデルの競争はChatの時代からAgentの時代へ移行しており、さらに「自己進化」が今後1年のAGIにとっての重要な出来事になると指摘した。

MarketWhisper3時間前
コメント
0/400
コメントなし