2026 年 6 月、Databricks 共同創業者の Matei Zaharia が Data + AI Summit 直前に Omnigent を GitHub で公開し、数日で star 数が 1 万を超えた。同時期、「Agent Harness」という語が Twitter、技術ブログ、Claude Code ドキュメントで頻出する——重要だとは分かるが、モデル・Agent・IDE のどれと違うのか説明できない人が多い。
左手で Claude Code、右手で Cursor Agent、ときどき Codex や自作スクリプトを使うなら、本稿で概念を整理し、Omnigent のような meta-harness(メタハーネス層) に今乗る価値があるか判断できる。公式:omnigent.ai。プロジェクトは Apache 2.0 オープンソース・alpha 段階——コマンドと API は急速に変わる可能性あり。本番導入はリポジトリの quickstart を正とすること。
結論先行:2026 年 AI プログラミングの分水嶺はオーケストレーション層にあり、モデルランキングではない。
-
Agent Harness = モデルの「OS」
ツール呼び出し、コンテキスト圧縮、権限境界、ReAct ループを担う。Claude Code、Cursor、Codex はいずれも Harness であり、モデルそのものではない。
Model + Harness
-
Omnigent = Harness 上のコントロールプレーン
1 行設定で Claude Code / Codex / カスタム YAML Agent を切替。Policy でコストとリスクを管理——prompt に祈るのではない。
Meta-Harness
-
向くのは:複数 Harness 並行チーム
単独で 1 IDE Agent なら様子見で可。3 人以上、モデルベンダー混在、共有セッションと監査が要るチームは alpha 試行の価値あり。
Alpha · セルフホスト
1. なぜ 2026 年みんな Harness を語るのか
2025 年の問いは「コードを書ける Agent をどう作るか」。2026 年は「5〜6 個の Agent を同時に走らせても暴走させないには」。典型:フロントは Cursor、バックエンド責任者は Claude Code CLI、運用スクリプトに Codex、ある事業線は YAML 定義のレビュー Agent——互いの存在を知らず、ルールもバラバラ、Token 請求は 4 コンソールに分散、git push を誰が承認したか誰も説明できない。
LangChain などコミュニティの式は明快:Agent = Model + Harness。モデルは推論;Harness は「推論に手を動かさせる」——ツール登録、bash 実行、ファイル I/O、履歴圧縮、ループ内の反復モデル呼び出し。LangChain の Harness 解剖記事 はシステムプロンプト、MCP、子 Agent 編成、Hook ミドルウェアをすべて Harness エンジニアリングと位置づけ、「プロンプト技巧」ではない。
本当に痛いのは個々の Harness の賢さではなく統一オーケストレーション層の欠如——ツールを替えるたびフロー書き直し、モデルを替えるたびルール再教育、協業はスクショとターミナル貼り付け。Omnigent が埋めようとするのはこの空白——Kubernetes がコンテナを束ねるように、複数 Harness を上から束ねる(公式は common orchestration layer)。これは当サイト Agent 開発モード全景と選定ガイド の「入口がワークフローを決める」と一致:モデルを替えても Harness と編成層が変わらなければ、チームは碎片化したまま。
2. Agent Harness とは:三層分類、モデルと混同しない
先に層を分けておく——後の選定が乱れない:
- L0 モデル(Model):Claude、GPT、Gemini 等の API。テキストまたは tool-call 構造を返すだけで、ディスクには触れない。
- L1 Agent Harness:モデルを実環境に接続する製品——Claude Code(ターミナル CLI)、Cursor(IDE Agent モード)、OpenAI Codex、Pi 等。実行ループ、権限プロンプト、プロジェクトコンテキスト注入を実装。
- L2 Harness 拡張パック:単一 Harness 上のスキルとルール。例:ECC (Everything Claude Code) の Skills、Hooks、AgentShield——「どう書くか」を強化し、Harness 自体は置き換えない。
- L3 Meta-Harness / コントロールプレーン:Omnigent の層。複数 L1/L2 を管理し、ポリシー・サンドボックス・セッション共有・多端末(ターミナル、Web、モバイル、REST)を統一。
非対称結論を再掲:モデル能力は天井、Harness は床;複数 Harness 共存時、床の高低は L3 編成層の有無で決まる。 「Claude と GPT どちらが強い」だけ議論し、5 つの Harness をバラバラに走らせるのは 2026 年最も多い組織レベルの失敗。
3. Omnigent とは:オープンソース meta-harness の四枚の切り札
公式紹介と GitHub README によると、Omnigent の核は二つ:Runner が任意 Agent をサンドボックス化・API 統一のセッションに包む;Server がポリシーと共有履歴を管理し、同一セッションをターミナル、Web UI(ローカル既定 http://localhost:6767)、デスクトップ、モバイル、REST API に露出。インストールは通常 1 行:
curl -fsSL https://omnigent.ai/install.sh | sh
注目すべき四能力(alpha 段階、バージョンで可用性は変動):
- コンポジション(Composition):同一タスク内で Claude Code、Codex、Pi、YAML カスタム Agent を切替または並列。設定変更で Harness を替え、リポジトリスクリプトの書き直し不要。
- ガバナンス(Governance):Contextual Policies——累計コスト閾値超過で一時停止、
npm install後のgit pushは人手承認など。「CLAUDE.md に push するなと書く」より実行可能。 - サンドボックス(Sandbox):OS レベルでファイルシステムとネットワークを制限。機密凭証はプロキシ注入、Agent は GitHub Token 平文を直接保持しない(Linux では bubblewrap、macOS では Seatbelt 等、リポジトリのセキュリティ文書参照)。
- コラボレーション(Collaboration):セッション URL 共有、同僚が傍観または co-drive——「ターミナルスクショ式」引き継ぎを削減。
内蔵サンプル Agent Polly(並列子 Agent + クロスベンダー Review)と Debby(デュアルモデル討論)は編成能力のデモであり、本番テンプレではない。ロードマップの GEPA 自動最適化、クロスセッション MCP 等は未 GA——「約束」ではなく「ポテンシャル」として評価すること。
4. 核心比較:裸 Harness、ECC、Omnigent の選び方
下の二表はフィールドを統一し、チーム内の言語を揃える。一つ目は「日常開発の入口」、二つ目は「編成とガバナンス」。
| ツール | 入口 | 実行能力 | コンテキスト | 向く人 |
|---|---|---|---|---|
| Claude Code | ターミナル CLI | bash、リポジトリ I/O、子 Agent、MCP | CLAUDE.md、セッション圧縮、プロジェクトツリー | ターミナル派、深い git 連携が要るエンジニア |
| Cursor | IDE 内 Agent / Tab | 多ファイル編集、ターミナル、ブラウザ(版次第) | .cursor/rules、Skills、@codebase | 視覚派、GUI と diff プレビューが好きな開発者 |
| OpenAI Codex | CLI / クラウドタスク | サンドボックス実行、長タスク、リポジトリ級変更 | AGENTS.md、環境プリセット | OpenAI エコシステム、自動化パイプライン寄り |
| Omnigent | 統一 CLI + Web + API | 上記 Harness のラップ + カスタム YAML Agent | Harness 横断のセッション履歴とポリシー | 複数ツール並行、強いガバナンスが要る技術責任者 |
| 次元 | 裸 Harness 単一ツールそのまま | + ECC(L2) 単一 Harness 強化 | + Omnigent(L3) 複数 Harness 編成 |
|---|---|---|---|
| 解く痛み | 個人効率 | ルール統一、記憶、品質ゲート | 多ツール統合、ポリシー、協業 |
| 切替コスト | IDE を替えると Harness も替わる | Claude Code/Cursor 間で Rules 同期可 | 設定 1 行で Harness/モデル切替 |
| 権限とコスト | 各ツールの確認ダイアログ | AgentShield、Hook 監査 | Policy エンジン、コスト上限、プログラム承認 |
| 学習コスト | 最低 | 中(Skills の裁剪が要る) | 高(alpha、セルフホストの理解) |
| クラウド Runner | Mac へ SSH で可 | Hook でリモートビルド起動 | Server 配置後、多端末が同一実行環境へ |
5. シナリオ別の選び方:決定マトリクス
役割で素早く分流——star 数比較より実用的。
- 個人フルスタック、Cursor か Claude Code のみ:裸 Harness + 簡素な
AGENTS.mdで十分。Omnigent は過剰。 - 小チーム 2–5 人、Harness 不統一:先に ECC または社内 Rules(L2)を統一し、Omnigent を評価。毎週「どの Agent を使うか」会議なら L3 のパイロット価値あり。
- 監査・コンプライアンスが要る R&D センター:Omnigent Policy + OS サンドボックスは散在 prompt より証明可能な制御に近い——ただし alpha リスク評価は必須。
- 7×24 個人分身 / IM チャネル:OpenClaw Gateway と Omnigent の役割分担を見る——前者は Channel と常時オンライン、後者は多 Harness コーディング編成。共存可だが権限モデルを混ぜない。
- iOS/macOS ビルド heavy:Harness 編成は「誰がコードを書くか」;
xcodebuildは安定 macOS Runner が要る。GitHub Actions セルフホスト macOS Runner とクラウド Mac を参照。
6. 推奨スタック(重ね合わせ可)
成熟度順に三つの検証済みスタック:
- 極簡個人スタック:Claude Code または Cursor + プロジェクト級
CLAUDE.md/.cursor/rules+ ローカル git。編成層ゼロ。プロトタイプと副業向き。 - チームコーディングスタック:メイン Harness を 1 つに統一(推奨)+ ECC を選択導入(minimal Hook)+ クラウド Mac Runner でテストと Archive。編成は L2、ガバナンスは CI と Code Review。
- 多 Harness 実験スタック:固定 Linux/macOS ホスト(またはクラウド Mac)に Omnigent Server + Policy でコストと git push 制限 + Polly 式「コーディング Agent + 異種 Review Agent」+ ノート/スマホから Web UI 傍観。技術責任者のサンドボックス向き——未レビューで本番リポジトリに接続しない。
7. よくある誤解
- Omnigent をモデルゲートウェイだけと思う:API 転送だけでは Harness 級ツール実行は得られない。L3 の価値はポリシーとマルチ Agent 協業であり、安くモデルを替えることではない。
- alpha リスクを軽視:API、設定形式、既定ポートは変わりうる。本番主線はバージョン固定とロールバック計画を。
- prompt で Policy の代わり:「DB を消すな」は長セッションで洗い流される。コスト上限と承認チェーンは実行可能なポリシーに書く。
- サンドボックス万能論:OS サンドボックスは凭証漏洩確率を下げるが、コードレビューの代替ではない。悪意ある依存は内網横移動しうる。
- ECC と二択:ECC は単一 Harness の SOP 強化;Omnigent は複数 Harness 管理——多くのチームは最終的に L2 + L3 を重ねる。
8. 落地ステップ:監査可能な多 Harness 試験場を 7 ステップで
- 棚卸し:チームが実際に使う Harness、モデルアカウント、月次コスト上限を列挙。
- 境界を引く:非本番 monorepo か fork でパイロット。本番キーへのデフォルトアクセスは禁止。
- インストール:公式スクリプトで Omnigent を導入。初回実行で自動検出されたモデル凭証が意図通りか確認。
- Policy 作成:最低 2 条——累計 Token/コスト閾値で一時停止;
git push/rm -rf類は人手承認。 - Harness 接続:最も慣れたもの(例:Claude Code)から。「単体テスト修正 → テスト実行」閉ループを通し、二つ目を交叉 Review 用に接続。
- 実行ノード固定:重タスクは 24h オンライン macOS(ローカル Mac mini またはクラウド Mac)へ。ノート閉蓋で長セッション中断を避ける。
- 振り返り:2 週間後に三つ——コストは制御できたか、承認は効率を殺していないか、同僚はスクショなしで協業できたか。一つでも不合格なら Scope 縮小または L2 へ戻る。
9. よくある質問
Q1. Agent Harness と AI Agent は同じ?
違う。 Agent は通常「自律的に目標を達成するシステム」;Harness はそのうち実行とコンテキスト管理を担うソフト層。口語の「Claude Code でコードを書く」は正確には「Claude Code という Harness で Claude モデルを動かす」。
Q2. Omnigent と Databricks の関係は?
Databricks チームによるオープンソース公開(Matei Zaharia 等)、Apache 2.0 ライセンス。Databricks 商用製品への強制バインドなし——自有モデルとインフラで可。Databricks データプラットフォーム利用企業には統合が加点だが前提ではない。
Q3. Omnigent を入れたら Cursor は不要?
IDE 体験が要るなら要る。 Omnigent は Cursor 背後の Agent 能力を編成するか、他 Harness と並列する——Cursor エディタ自体は置き換えない。純 CLI チームは Claude Code + Omnigent のみでも可。
Q4. コストは上がる?
安くも高くもなりうる。 マルチ Agent 並列は Token 消費を押し上げる一方、Policy のコスト上限と「重い仕事を誤ったモデルにやらせる」無駄は減る。パイロットでは必ず請求アラートを。
Q5. なぜ本文でクラウド Mac をよく言及する?
Harness は安定 OS の上に乗る。 iOS/macOS ビルド、署名、notarytool は本物 macOS のみ。Omnigent Server をクラウド Mac に置けば、ノート閉蓋後もセッションと Runner がオンライン——OpenClaw、GitHub Actions セルフホスト Runner と同じ「実行ノード」問題。
10. まとめ
Agent Harness はマーケ用語ではなく、2026 年エンジニアリング界が「モデル以外の実行インフラ」に付けた共通名。Claude Code、Cursor、Codex は L1 体験を争う;ECC は L2 を強化;Omnigent は L3 に戦火を移す——誰がやるか、いくらか、セッション共有できるか、承認チェーンを証明できるか。
単独単ツールなら焦る必要なし。複数 Harness のチームは、2 週間の alpha 試行で「編成層」の地図を手に入れる価値がある。どの層を選んでも、Agent に安定・SSH 可能・xcodebuild が走る macOS を——脳がクラウドでも、手はクラウドに。
多 Harness 編成、実行ノードはクラウド Mac が安定
Omnigent、Claude Code、CI を同時に走らせると、ノート閉蓋で長セッションが切れる。Hashvps カナダ M4 ベアメタル macOS、専用 IP、低消費電力 7×24 オンライン——Omnigent Server と xcodebuild Runner の固定実行面に最適。編成層は L3、ビルドと署名は本物 Apple ハードウェアで。
Agent ワークフローのリモート実行ノードを計画中なら、 Hashvps クラウド Mac mini M4 はコスパの良い起点—— プランを今すぐ確認 、Harness をローカルハードの中断から解放しよう。