プロローグ ─ Demo は走るのに、パターンが崩れると業務に乗らない

2026/05/10

プロローグ ─ Demo は走るのに、パターンが崩れると業務に乗らない

第1部で、業務投入できる AI エージェントは 6 レイヤの技術スタック で構成されることを示した。推論・計画、ツール接続、メモリ、実行環境、オーケストレーション、常時稼働、観測 ── 部品は揃った。

だが、部品を集めるだけではエージェントは動かない。部品の並べ方 ── アーキテクチャパターン ── を間違えると、第1部で挙げた「Demo は派手なのに、業務に乗らない」現象が別の形で再発する。

本章では、第2部全体の問題提起をする。

「マルチエージェントを入れたら良くなる」という誤解

2025 年に頻繁に起きた現象がある。1 エージェントで動いていたものを「マルチエージェントにして良くしよう」と分割した結果、品質が落ちた、という現象だ。

象徴的なのは、Cognition AI（Devin の開発元）が公開している主張だ：

並列に動く sub-agent は、それぞれが勝手に前提を作って衝突する。Flappy Bird 風のゲームを 2 つのエージェントに分割実装させたら、片方は「鳥はマリオ風のキャラ」と仮定し、もう片方は「背景は宇宙空間」と仮定して、合わせると噛み合わないものができた。

これに対して、Anthropic は別のスタンスをとる：

Lead Agent + 3〜5 Sub-agents の構成で、シングルエージェント比 +90.2% の性能向上を観測した。ただし約 15 倍のトークン消費。

両者は どちらも正しい。違いは、**タスクが「動的に分割可能か」と「sub の前提が衝突しないか」**にある。コーディングのように深い前提共有が必要なタスクは Cognition が正しく、リサーチのように独立並列できるタスクは Anthropic が正しい。

つまり、「マルチエージェントを入れる」が答えではない。「このタスクのパターンは何か」が答えだ。これがパターン設計の入口になる。

8 つの基本パターン × 6 トポロジー × HITL ── 本作の地図

本作で扱う設計の選択肢を、3 つの軸で整理する。

graph TB
    subgraph axis1["8 つの基本パターン (ch2)"]
        P1[Augmented LLM]
        P2[Prompt Chaining]
        P3[Routing]
        P4[Parallelization]
        P5[Orchestrator-Workers]
        P6[Evaluator-Optimizer]
        P7[Autonomous Agent]
        P8[Harness + Sandbox]
    end

    subgraph axis2["6 トポロジー (ch3)"]
        T1[Single]
        T2[Supervisor-Worker]
        T3[Swarm]
        T4[Router]
        T5[Hierarchical]
        T6[Pipeline]
    end

    subgraph axis3["HITL 設計 (ch5)"]
        H1[6 箇所]
        H2[6 実装]
        H3[4 リスク]
    end

    Task[業務タスク] --> axis1
    axis1 --> axis2
    axis2 --> axis3
    axis3 --> Done[業務投入できるエージェント]

このシリーズの主張は単純だ：

基本パターン 8 個：Anthropic「Building Effective Agents」の 5+1 に、Autonomous Agent と Harness+Sandbox を加えた 8 つ。これがパターンの最小語彙
トポロジー 6 種：基本パターンを実装するときの**「形」**。Single / Supervisor-Worker / Swarm / Router / Hierarchical / Pipeline
HITL 設計：自律と監視のスペクトルを 6 箇所 × 6 実装パターンで設計する。これを抜くと業務に投入できない

これらをすべて掛け合わせると、Devin が「Single + ReAct loop + 人間の PR レビュー必須」、Replit Agent 3 が「Hierarchical (Stacks) + Self-healing loop + Max Autonomy 切替」、Cursor Composer 2 が「Plan-and-Act + Plan/Execute 二段階分離」、Anthropic Multi-agent Research が「Supervisor-Worker + Evaluator-Optimizer」というふうに、実在エージェントを言語化できる。

なぜ「パターン」を語ることが業務投入で重要か

「業務投入できるエージェント」と「Demo」の違いは、設計の意図が説明できるかどうかにある。

技術選定でよく聞く問いに、「なぜ LangGraph を選んだのか」「なぜマルチエージェントにしたのか」がある。これに「LangGraph が流行っているから」「マルチエージェントの方がかっこいいから」と答えるエンジニアは、business stakeholder に説明責任を果たせない。

逆に、「このタスクは Routing パターンで、入力カテゴリが明確だから」「Orchestrator-Workers は ROI が出るのが重並列タスクだけで、我々のユースケースは違うから Single Agent にした」と答えられるエンジニアは、選定の根拠を持っている。根拠を持っているから、後から戻して再判断できる。

これがパターン設計が業務投入で必須の理由だ。選択の根拠を持たないと、運用フェーズで小さな問題が起きるたびに「もっと別のフレームワークに変えよう」「もっと多くのエージェントに分割しよう」と迷走する。

業界が「パターン」に収束しつつある

幸いなことに、2025-2026 年で業界全体がパターン語彙に収束している。代表的な動きを整理する。

提唱元	パターン体系	特徴
Anthropic	Building Effective Agents 5+1	最も影響力のある分類。Workflow vs Agent の対立軸
LangChain	LangGraph multi-agent patterns（Network / Supervisor / Hierarchical）	実装に直結
Microsoft	Agent Framework の 5 orchestration（Sequential / Concurrent / Handoff / Group Chat / Magentic-One）	エンプラ寄り、graph-based
OpenAI	Agents SDK の Handoffs + 2026-04 で Harness パターン	sandbox + harness が独立パターン化
CrewAI	Crews（役割 + 会話） + Flows（イベント駆動）	直感的な「人間チーム」モデル

これらは互いに矛盾していない。本作は ch2 で、これらを横断する 8 パターンに絞った最小語彙 を提示する。

第1部からの伏線回収

第1部で「Agent ＝ Model + Harness」と書いた。第2部はこの「Harness」の中身を、パターンとして解剖する。

第1部の表現	第2部の言い換え
Layer 1: 推論・計画	パターン語彙では Augmented LLM + Autonomous Agent Loop
Layer 5: オーケストレーション	パターン語彙では Orchestrator-Workers + Pipeline + Router
Layer 6: 常時稼働	トポロジーが「持続可能なものか」の判定軸
Layer 7: 観測	HITL 設計の retroactive review / spot check と直結

つまり**第1部のスタックを、第2部のパターンで「組み立てる」**のが本作の役割だ。

本章のまとめと次章への接続

「マルチエージェントを入れる」が答えではなく、「このタスクのパターンは何か」が答え：Cognition と Anthropic の論争はそれを示している
本作は 3 軸で設計を整理：8 つの基本パターン × 6 トポロジー × HITL 設計
業務投入には設計の意図が言語化できることが必須：「LangGraph を使ったから」では業務 stakeholder に答えられない
業界がパターン語彙に収束：Anthropic / LangChain / Microsoft / OpenAI / CrewAI が矛盾しない分類を提示

次の ch2 では、まず最小語彙としての 8 パターンを確定する。Anthropic「Building Effective Agents」の 5+1 を起点に、Autonomous Agent Loop と Harness+Sandbox を加えた 8 つを、それぞれ「いつ使うべきか / いつ使ってはいけないか」のセットで定義する。

この章のまとめ

部品があってもパターンが間違うと業務に乗らない：第1部の 6 レイヤだけでは不十分
マルチエージェントは万能ではない：Cognition は「sub-agent が前提を作って衝突する」と警告、Anthropic は「並列リサーチでは +90.2%」と効果を実証 ── どちらもタスクによって正しい
本作の地図は 8 パターン × 6 トポロジー × HITL 設計
業界がパターン語彙に収束：Anthropic / LangChain / Microsoft / OpenAI / CrewAI のパターンは矛盾しない
第1部のスタック（部品）を、第2部のパターン（並べ方）で「組み立てる」