目次を表示する

browser-use完全解説

第9章 エピローグ ── ブラウザエージェントが示す地平

第9章 エピローグ ── ブラウザエージェントが示す地平


市場の評価

browser-useに対するコミュニティの評価は大きく二つに割れている。

熱狂側の主張

  • GitHubスター81,200+という急成長は「本当に使えるものへの反応だ」
  • 「APIを持たないすべてのWebサービスへのアクセスを民主化する」
  • RPA業界(UiPath・Automation Anywhere)の構造的な代替になる
  • Fortune 500の採用が始まっており、エンタープライズ市場が開いている

懐疑・批判側の主張

  • 「WebVoyager83%というベンチマークは、実際のプロダクションでは遥かに低い成功率だ」
  • LLMコストのスケーリング問題は本質的に解決されていない
  • プロンプトインジェクションは「フロンティアの未解決問題」と言われており、高リスクタスクへの適用には限界がある
  • 「Playwrightでいい案件をbrowser-useでやって失敗している事例が多すぎる」

両方の評価が正しい。browser-useは「特定のユースケースで強力なツール」であり、「万能のWeb自動化ソリューション」ではない。


成熟度曲線のどこにいるか

graph LR
    subgraph "Gartnerハイプサイクル的位置づけ(推定)"
        P1["過剰期待のピーク<br/>(2025前半)<br/>「何でもできる」"]
        P2["幻滅のトラフ<br/>(2025後半〜2026)<br/>「本番で想定より難しい」"]
        P3["啓発の斜面<br/>(2026〜)<br/>「適切な使い方が分かってきた」"]
        P4["生産性の安定期<br/>(2027〜?)<br/>「ベストプラクティスが定着」"]
    end

    P1 --> P2 --> P3 --> P4
    P3 -. "今ここ" .-> P3

2026年3月時点のbrowser-useは「幻滅のトラフから啓発の斜面に移行しつつある段階」と見ることができる。

「とりあえず試してみたが本番では動かなかった」という体験が蓄積され、それをもとに「こういうケースには使える、こういうケースには向かない」という知見が言語化されてきている。本シリーズのベストプラクティス・アンチパターンの記述も、この啓発フェーズの産物だ。


今後の方向性

モデルの改善

BU 1.0→BU 2.0で精度が12%向上した(74.7%→83.3%)。モデルの改善サイクルが続くなら、2026年末には90%近い精度が現実的になるかもしれない。精度が上がるほど「本番環境での信頼性」という最大の懸念が薄れる。

コストの低下

LLMの推論コストは急速に低下している。2023年比で、同等モデルのAPI費用が10〜100分の1になった製品もある。この傾向が続けば、「LLMコストが高すぎて高頻度実行に使えない」という制約は緩和される。

Stagehandのキャッシュ機能のような最適化

Stagehandが導入した「成功したアクションのセレクターキャッシュ」は、繰り返しタスクのコストをPlaywright並みに近づける。browser-useにも同様の最適化が取り込まれる可能性がある。

セキュリティの進化

プロンプトインジェクションは「完全に解決できない」が、「実用的な防御層の整備」は進んでいる。ファインチューニングによる攻撃耐性、自動レッドチーム、SecondaryモデルによるアクションのQA——これらが成熟するにつれ、高リスクタスクへの適用可能性が広がる。


設計者へのメッセージ

browser-useを自分のプロダクト・システムに組み込もうとする開発者へ。

まず問うこと:このタスクはPlaywrightで書けるか?書けるならPlaywrightで書くべきだ。browser-useが正当化されるのは「書けない、あるいは書いたときの保守コストが高い」ときだ。

次に問うこと:このエージェントが「最悪の動き」をしたとき、どんな被害が起きるか?被害が大きいなら、Human-in-the-Loopを設計に組み込む。専用プロファイルを使う。ドメインをホワイトリストにする。

最後に問うこと:このタスクを外部Webサイトのコンテンツで処理するか?するなら、そのコンテンツがプロンプトインジェクションを試みる可能性があることを設計の前提にする。

browser-useは強力だ。しかし「強力なツールほど使い方が問われる」という原則は、AIエージェントにも当てはまる。


参考文献・情報源


本シリーズは 2026年3月31日時点の情報を元に執筆しました。