Terrill Dicki2026年3月12日 01:55LangChainのDeep Agents SDKは、AIモデルが自らのコンテキストウィンドウの圧縮タイミングを判断できるようになり、長時間稼働するエージェントのワークフローにおける手動介入を削減します。LangChainは、Deep Agents SDKのアップデートをリリースし、AIモデルに自身のメモリ管理の鍵を渡しました。2026年3月11日に発表された新機能により、エージェントは固定されたトークン閾値や手動コマンドに頼ることなく、自律的にコンテキスト圧縮をトリガーできるようになりました。この変更は、エージェント開発における永続的な悩みの種である、コンテキストウィンドウの満杯問題に対処します。従来のシステムは、モデルのコンテキスト制限の85%に達したときにメモリを圧縮しますが、これはリファクタリングの途中や複雑なデバッグセッション中に起こることもあります。タイミングが悪いと、コンテキストを失い、ワークフローが壊れる原因となります。## なぜタイミングが重要かコンテキスト圧縮は新しい技術ではありません。古いメッセージを凝縮した要約に置き換えることで、エージェントをトークン制限内に収める手法です。しかし、圧縮のタイミングが重要です。LangChainの実装では、最適な圧縮タイミングをいくつか特定しています。たとえば、タスクの区切りや、ユーザーが焦点を移すとき、大規模な調査コンテキストから結論を抽出した後、長時間にわたる複数ファイルの編集を始める前などです。エージェントは、散らかる前に自ら整理を始めることを学習します。2024年12月にFactory AIが発表した研究もこのアプローチを裏付けています。同研究では、積極的な切り捨てではなく、コンテキストの連続性を保つ構造化要約が、デバッグなどの複雑なエージェントタスクにとって重要であることが示されました。ワークフローの構造を維持したエージェントは、単純なカットオフ方式を用いたものよりも大きく優れた結果を出しました。## 技術的な実装このツールは、Deep Agents SDK(Python)のミドルウェアとして提供され、既存のCLIと連携します。開発者はエージェントの設定に追加します。システムは、利用可能なコンテキストの10%を最新のメッセージとして保持し、それ以前の内容を要約します。LangChainは安全策も組み込んでおり、完全な会話履歴はエージェントの仮想ファイルシステムに保存され、圧縮に失敗した場合でも復元可能です。内部テストでは、エージェントは圧縮のタイミングについて慎重に動作しました。LangChainは、Terminal-bench-2やLangSmithのトレースを用いたカスタム評価スイートでこの機能を検証しています。エージェントが自律的に圧縮を行った場合でも、ワークフローの連続性を改善するタイミングを一貫して選択しました。## より大きな視野このリリースは、エージェントアーキテクチャの哲学における広範な変化を反映しています。LangChainは、リチャード・サットンの「苦い教訓」を明示的に引用しています。それは、計算を活用した一般的な手法が、時間とともに手作業の調整よりも優れる傾向があるという観察です。開発者がエージェントのメモリ管理のタイミングを細かく設定するのではなく、フレームワークがその判断をモデルに委ねることで、より効率的な運用を目指しています。これは、GPT-5.4のようなモデルの推論能力が、これらの運用判断を信頼できるレベルに達しているという前提に基づいています。長時間稼働やインタラクティブなエージェントを構築する開発者にとって、この機能はSDKを通じてオプトイン可能であり、CLIの/compactコマンドから利用できます。実用的な効果は、ワークフローの中断が減り、ほとんどのエンドユーザーが理解していないコンテキスト制限に関する手動調整の手間が省かれることです。*画像出典:Shutterstock*
LangChainがAIエージェントに独自のメモリ管理の制御を与える
Terrill Dicki
2026年3月12日 01:55
LangChainのDeep Agents SDKは、AIモデルが自らのコンテキストウィンドウの圧縮タイミングを判断できるようになり、長時間稼働するエージェントのワークフローにおける手動介入を削減します。
LangChainは、Deep Agents SDKのアップデートをリリースし、AIモデルに自身のメモリ管理の鍵を渡しました。2026年3月11日に発表された新機能により、エージェントは固定されたトークン閾値や手動コマンドに頼ることなく、自律的にコンテキスト圧縮をトリガーできるようになりました。
この変更は、エージェント開発における永続的な悩みの種である、コンテキストウィンドウの満杯問題に対処します。従来のシステムは、モデルのコンテキスト制限の85%に達したときにメモリを圧縮しますが、これはリファクタリングの途中や複雑なデバッグセッション中に起こることもあります。タイミングが悪いと、コンテキストを失い、ワークフローが壊れる原因となります。
なぜタイミングが重要か
コンテキスト圧縮は新しい技術ではありません。古いメッセージを凝縮した要約に置き換えることで、エージェントをトークン制限内に収める手法です。しかし、圧縮のタイミングが重要です。
LangChainの実装では、最適な圧縮タイミングをいくつか特定しています。たとえば、タスクの区切りや、ユーザーが焦点を移すとき、大規模な調査コンテキストから結論を抽出した後、長時間にわたる複数ファイルの編集を始める前などです。エージェントは、散らかる前に自ら整理を始めることを学習します。
2024年12月にFactory AIが発表した研究もこのアプローチを裏付けています。同研究では、積極的な切り捨てではなく、コンテキストの連続性を保つ構造化要約が、デバッグなどの複雑なエージェントタスクにとって重要であることが示されました。ワークフローの構造を維持したエージェントは、単純なカットオフ方式を用いたものよりも大きく優れた結果を出しました。
技術的な実装
このツールは、Deep Agents SDK(Python)のミドルウェアとして提供され、既存のCLIと連携します。開発者はエージェントの設定に追加します。
システムは、利用可能なコンテキストの10%を最新のメッセージとして保持し、それ以前の内容を要約します。LangChainは安全策も組み込んでおり、完全な会話履歴はエージェントの仮想ファイルシステムに保存され、圧縮に失敗した場合でも復元可能です。
内部テストでは、エージェントは圧縮のタイミングについて慎重に動作しました。LangChainは、Terminal-bench-2やLangSmithのトレースを用いたカスタム評価スイートでこの機能を検証しています。エージェントが自律的に圧縮を行った場合でも、ワークフローの連続性を改善するタイミングを一貫して選択しました。
より大きな視野
このリリースは、エージェントアーキテクチャの哲学における広範な変化を反映しています。LangChainは、リチャード・サットンの「苦い教訓」を明示的に引用しています。それは、計算を活用した一般的な手法が、時間とともに手作業の調整よりも優れる傾向があるという観察です。
開発者がエージェントのメモリ管理のタイミングを細かく設定するのではなく、フレームワークがその判断をモデルに委ねることで、より効率的な運用を目指しています。これは、GPT-5.4のようなモデルの推論能力が、これらの運用判断を信頼できるレベルに達しているという前提に基づいています。
長時間稼働やインタラクティブなエージェントを構築する開発者にとって、この機能はSDKを通じてオプトイン可能であり、CLIの/compactコマンドから利用できます。実用的な効果は、ワークフローの中断が減り、ほとんどのエンドユーザーが理解していないコンテキスト制限に関する手動調整の手間が省かれることです。
画像出典:Shutterstock