Gate Newsメッセージ、4月27日――AlibabaのPAIチームが、産業グレードのツール呼び出し(tool-calling)用途向けに設計された小規模のエージェンティック言語モデル「AgenticQwen」をリリースし、オープンソース化しました。このモデルは2つのバージョンに分かれています:8Bと30B-A3B。革新的な"dual data flywheel"強化学習フレームワークを通じて学習されたAgenticQwenは、推論コストを大幅に削減しつつ、ほぼ1兆パラメータ級のモデル・レベルでのエージェント機能を実現します。
デュアルデータ・フライホイールの仕組みは、従来の合成データにおける均質化問題に対処します。推論フライホイールは、モデルの誤りからより難しいバリアントを自動生成し、一方でエージェンティック・フライホイールは、単一予約プロセス(のような単純な線形ワークフロー)を、制約、却下、敵対的な条件を伴うマルチ分岐の行動ツリーベースへと拡張し、現実世界の複雑な意思決定シナリオをシミュレーションします。ベンチマークでは、AgenticQwen-8Bが実ツール環境ベンチマーク(TAU-2およびBFCL-V4)で47.4を獲得し、ベースのQwen3-8B(23.8)を大幅に上回り、Qwen3-235B(52.0)に接近しました。AgenticQwen-30B-A3Bは(起動(アクティブ)されるパラメータが3Bのみ)で50.2を達成しました。
このモデルはManusに類似した社内の本番システムに導入されており、エンドツーエンド推論時間において235Bモデルとの差を大幅に縮めています。しかし、ネイティブのコンテキスト長が40Kトークンに制限されているため、深い探索タスクでの性能が制約されます。