2026年、AI産業に新しい共通認識が生まれた。AI製品の良し悪しを決めるのはモデルそのものではなく、「harness」と呼ばれる、モデルの外側の層だということだ。Claude Code、Cursor、OpenClawが使用する基盤モデルがますます近づいていく一方で、実際にプロダクトの差を生み出すのはharnessの設計である。Martin Fowlerの技術ブログ、Anthropicのプロダクト責任者trq212、そしてAndrej Karpathyの最近の発言はすべて、同じ方向性を示している。AIの次の戦場はHarness Engineeringだ。
什麼是 Agent Harness
AIエージェントは2つの部分に分解できる。モデル(Model)とHarnessだ。モデルは脳であり、言語の理解と推論を担う。Harnessはモデル以外のすべて――ツール呼び出し、メモリ管理、コンテキストの組み立て、状態の永続化、エラー処理、安全ガードレール、タスクのスケジューリング、ライフサイクル管理。
直感的な比喩で言うと、LLMは1頭の馬で、harnessは馬具――手綱、鞍、そして馬車との連結構造だ。馬具がなければ、馬がどれほど強くても車を引けない。AIエージェントも同様で、モデルがどれほど賢くても、良いharnessがなければ実際のタスクを確実に完了できない。
Akshay Pachaarが広く拡散されたツイートで別の比喩を示している。「裸のLLMは、OSのないCPUのようなもの――計算はできるが、自分だけでは役に立つことは何もできない」。Harnessは、そのOSだ。
なぜ2026年にHarness Engineeringが突然重要になるのか
理由は3つある。
第一に、モデル能力が同質化していること。GPT-5.4、Claude Opus 4.6、Gemini 3.1 Proの多くのベンチマークテストにおける差は、すでに個々の一桁のパーセントポイントへと縮小している。モデルがボトルネックでなくなると、プロダクトの差別化は自然にharness層へ移る。
第二に、エージェントが実験から本番へ入ってきたこと。2025年のエージェントの多くはデモだが、2026年のエージェントは企業環境で稼働する必要がある。中断からの復旧、長時間稼働、多段階タスク、権限制御に対応しなければならない。これらはすべてharnessの仕事だ。
第三に、LLMは生まれつきステートレスだということ。新しいsessionのたびにゼロから始まり、モデルは前回の会話を覚えていない。Harnessが、記憶、コンテキスト、作業の進捗を永続化し、エージェントが本当の「同僚」のように継続して働けるようにする。
Harnessのコアコンポーネント
完全なagent harnessは、通常、次のような複数の層を含む:
コンポーネント 機能 比喩 Orchestration Loop agentの「考える→行動する→観察する」の循環を制御 作業システムのメインループ Tool Management agentが利用できるツールの管理(ファイルの読み書き、API呼び出し、ブラウザ操作など) ドライバプログラム Context Engineering 毎回モデルを呼び出すときにどの情報を渡し、どの情報を切り取るかを決める メモリ管理 State Persistence 作業の進捗、会話履歴、中間結果を保存 ハードディスク Error Recovery 失敗を検知し、自動で再試行またはロールバック 例外処理 Safety Guardrails agentの行動範囲を制限し、危険な操作を防ぐ ファイアウォール Verification Loops エージェントが出力品質を自己検査できるようにする ユニットテスト
3層のエンジニアリング:Prompt、Context、Harness
LLMのエンジニアリング実践は、3つの同心円状のレイヤーに分けられる:
最も内側はPrompt Engineering――モデルに送る指示の設計で、モデルが「どう考えるか」を決める。これは2023年の主流スキルだ。
中間層はContext Engineering――モデルが「何を見るか」を管理する。どの情報をどのタイミングでcontext windowに入れるか、どれを切り取るべきかを決める。context windowが100万token規模まで拡大するにつれ、この層の重要性は2025年から見え始めた。
最外層はHarness Engineering――前者2つを含み、さらにアプリケーションの基盤インフラ全体もカバーする。つまりツールのオーケストレーション、状態の永続化、エラーリカバリ、検証ループ、安全メカニズム、ライフサイクル管理。ここが2026年のコアな戦場だ。
実例:なぜ同じモデルが異なるプロダクトで天と地ほど違うのか
Claude Opus 4.6はClaude Code内では1時間ほどでコードベース全体を再構成できる。しかし同じモデルをAPI経由で簡素なharnessに接続した場合、ファイルをまたぐバグ修正すらうまくできないことがある。違いはモデルではなくharnessにある。
Claude Codeのharnessは何をしているのか?
コードベース全体を自動検索して関連ファイルを見つける。ユーザーに逐一指定させない
変更前にファイル内容を読み取り、変更後にテストを実行して検証する
テストが失敗したら、エラーを自動分析して再試行する
MCPで外部ツール(GitHub、データベースなど)に接続する
メモリシステムがsessionをまたいでユーザーの嗜好とプロジェクトの文脈を保存する
Advisorの戦略で、異なる能力のモデル同士が分業協力する
これらはすべてharnessの功績だ。
FeedforwardとFeedback:Harnessの2つの制御モード
Martin Fowlerの技術ブログの分析によれば、harnessの制御メカニズムは2種類に分けられる:
Feedforward(フィードフォワード制御)―― agentの行動の前にルールを設定し、望ましくない出力を防ぐ。例えば、system prompt内の行動規範、ツールのホワイトリスト、ファイルアクセス権限。
Feedback(フィードバック制御)―― agentの行動後に結果を確認し、自己修正を許可する。例えば、テストを実行してコードが正しいことを確認する、出力を想定フォーマットと照合する、幻覚を検知して再生成する。
良いharnessは、2つの制御を同時に使う。行動範囲を制限しつつ、柔軟性も保つ。
Harness Engineeringのプロダクト化:Anthropicはどうやってやるのか
2026年4月にAnthropicが集中的にリリースしたプロダクト更新は、ほぼすべてharness engineeringのプロダクト化だ:
Managed Agents――harnessの基盤インフラ(サンドボックス、スケジューリング、状態管理)をマネージドサービス化し、開発者はagentの振る舞いを定義するだけでよい
Advisor戦略――harness層のモデル混用アーキテクチャで、より強いモデルにいつ相談すべきかを自動判断する
Cowork企業版――非技術ユーザーに対して、完全なharness(権限制御、支出管理、利用分析)を提供し、彼らが基盤技術を理解する必要をなくす
Anthropicのプロダクト責任者trq212の説明が最も的確だ。「Promptingはagentと会話するためのスキルだが、それはharnessによって仲介されている。私のコア目標は、人間とagentの間の帯域幅を広げることだ。」
開発者にとっての意味:新しい職業と新しいスキル
Harness Engineeringは、独立したエンジニアリング領域になりつつある。必要なスキルの組み合わせは、従来のバックエンドエンジニアリングやMLエンジニアリングとは異なる:
LLMの能力の境界と失敗パターンを理解する
信頼性の高いツール呼び出しとエラー処理のフローを設計する
context windowを管理する――いつ、どの情報を詰め込むか
可観測性を構築する――agentの意思決定の経路とツール利用を追跡する
安全設計――agentの行動範囲を制限しつつ、その能力を窒息させない
Vibe Codingを学んでいる、あるいはAIツールで開発している人にとって、harnessの概念を理解することは、AIエージェントとより効果的に協働するのに役立つ。なぜなら、問題がモデルにあるのかharnessにあるのか、そして(プロンプトを何度も直すのではなく)harness設定を調整することで結果をどう改善できるかが分かるからだ。
結び:次の10年のインフラをめぐる争い
AIモデルの競争は止まらないだろうが、限界利益は逓減している。harness層の競争はまだ始まったばかりだ――最も信頼でき、最も柔軟で、最も安全なharnessを構築できる者が、同じモデル能力をより良いプロダクト体験へと転換できる。
これが、なぜAnthropic、OpenAI、Googleが「モデル会社」から「プラットフォーム会社」へ転換しつつあるのかを説明している。彼らが売っているのは、もはやモデルAPIだけではなく、完全なharness基盤インフラなのだ。開発者にとって、harness engineeringを理解することは選択肢ではない。AI時代にプロダクトを構築するための中核となる素養だ。
この記事 Harness Engineering とは何か?AIの次の戦場はモデルではなく、モデルの外側のその層のアーキテクチャである。最初に出現した場所:鏈新聞 ABMedia。