← К дневнику

Agent Harness простыми словами: разбираем хайповый Omnigent (2026)

AI-стек · 2026.06.22 · ~12 мин

Оркестрация AI-агентов на нескольких устройствах и облачный workflow

В июне 2026 сооснователь Databricks Матей Захария опубликовал на GitHub Omnigent накануне Data + AI Summit — за несколько дней проект набрал более десяти тысяч звёзд. Параллельно термин Agent Harness заполонил Twitter, технические блоги и документацию Claude Code. Многие чувствуют, что это «важно», но не могут чётко отделить модель, агента и IDE.

Если слева у вас Claude Code в терминале, справа Cursor Agent, а иногда Codex или свои скрипты, этот материал поможет разложить понятия и решить, стоит ли пилотировать meta-harness вроде Omnigent уже сейчас. Официальный сайт: omnigent.ai; статус: Apache 2.0, alpha — команды и API могут быстро меняться, ориентируйтесь на quickstart в репозитории.

Коротко: в 2026 году решает слой оркестрации, а не рейтинг моделей.

  • Agent Harness = «ОС» модели

    Вызовы инструментов, сжатие контекста, границы прав и цикл ReAct; Claude Code, Cursor и Codex — это harnesses, не модели.

    Model + Harness

  • Omnigent = control plane сверху

    Одна строка конфигурации переключает Claude Code, Codex или YAML-агента; policies управляют расходами и риском вместо надежды на prompt.

    Meta-Harness

  • Имеет смысл при параллельных harnesses

    Один человек и один IDE-агент — можно подождать. Команда от трёх, смешанные поставщики, общие сессии и аудит — alpha-пилот оправдан.

    Alpha · self-hosted

1. Почему в 2026 все говорят о Harness

В 2025 спрашивали «как сделать агента, который пишет код»; в 2026 — «как запустить пять-шесть агентов параллельно и не потерять контроль». Типичная картина: фронт на Cursor, лид бэкенда на Claude Code CLI, в ops-скриптах Codex, у продуктовой линии свой YAML-агент для ревью — они не знают друг о друге, правила разбросаны, счета за токены в четырёх консолях, и после git push неясно, кто одобрил.

Сообщество формулирует кратко: Agent = Model + Harness. Модель рассуждает; harness делает рассуждение исполнимым — регистрирует инструменты, запускает bash, читает/пишет файлы, сжимает историю, снова вызывает модель в цикле до завершения задачи. Статья LangChain The Anatomy of an Agent Harness относит системные промпты, MCP, оркестрацию суб-агентов и hook-middleware к инженерии harness, а не к «трюкам промпта».

Боль редко в «глупом» harness, а в отсутствии единого слоя оркестрации: смена инструмента = переписывание flow, смена модели = заново объяснять правила, совместная работа через скриншоты и вставку из терминала. Omnigent закрывает эту дыру — как Kubernetes управляет контейнерами, он управляет harnesses (официальная формулировка: common orchestration layer). Это согласуется с нашим обзором режимов разработки агентов: точка входа определяет workflow; частая смена модели без дисциплины harness/оркестрации фрагментирует команду.

Для команд с требованиями AI Act и внутреннего аудита узкое место 2026 смещается с «какой LLM?» на «кто что может выполнить и с каким доказательством?». Meta-harness отвечает на этот вопрос — не идеально в alpha, но структурнее разрозненных prompt-файлов.

2. Что такое Agent Harness? Три слоя, не путать с моделью

Сначала классификация, потом выбор:

  • L0 Модель (Model): Claude, GPT, Gemini и др. через API; текст или структура tool-call, без прямого доступа к диску.
  • L1 Agent Harness: продукт, подключающий модель к реальной среде — Claude Code (CLI в терминале), Cursor (агент в IDE), OpenAI Codex, Pi и аналоги. Реализуют цикл выполнения, диалоги прав и контекст проекта.
  • L2 Усиление harness: skills и правила поверх одного harness, напр. ECC (Everything Claude Code) со Skills, Hooks и AgentShield — улучшает как пишется код, не заменяет harness.
  • L3 Meta-Harness / control plane: здесь Omnigent — управляет несколькими L1/L2, единые policies, sandbox, общие сессии и мультиустройственный доступ (терминал, web, мобильный, REST).

Асимметричный вывод: модель задаёт потолок, harness — пол; при нескольких harnesses L3 решает, ровный пол или минное поле. Спорить «Claude или GPT сильнее», оставляя пять несогласованных harnesses, — самая частая организационная ошибка 2026.

Стек агента: от модели к meta-harness L3 · Omnigent (Policy · Sandbox · мульти-сессия · мульти-устройство) L2 · ECC и расширения (Skills · Hooks · правила · security-scan) L1 · Claude Code Cursor Codex YAML-агент L0 · API модели (Claude / GPT / Gemini / self-hosted vLLM)
Omnigent наверху: не заменяет Claude Code или Cursor, а оркестрирует их

На практике L1 — где вы вводите команды (терминал, IDE, API-job). L2 стандартизирует качество внутри входа. L3 стандартизирует кто каким входом пользуется, когда, и как сессии делятся между ролями. Без L3 каждый harness — silo со своей памятью и расходами.

3. Что такое Omnigent? Четыре карты open-source meta-harness

По официальной документации и README GitHub архитектура делится на Runner (оборачивает любого агента в sandboxed-сессию с единым API) и Server (policies, общая история, та же сессия в терминале, web UI по умолчанию http://localhost:6767, desktop, mobile и REST). Установка обычно одной командой:

Установка Omnigent (официальный install.sh)
curl -fsSL https://omnigent.ai/install.sh | sh

Четыре направления (alpha — доступность зависит от версии):

  1. Composition: в одной задаче переключать или параллелить Claude Code, Codex, Pi или YAML-агента; смена harness через конфиг, без переписывания repo-скриптов.
  2. Governance: Contextual Policies — пауза при пороге расходов, ручное одобрение git push после npm install; исполнимее, чем «не пушьте» в CLAUDE.md.
  3. Sandbox: ограничения ОС на ФС и сеть; секреты через proxy, без plaintext GitHub Token в агенте (на Linux часто bubblewrap, на macOS Seatbelt — см. security docs в репозитории).
  4. Collaboration: URL сессии для коллег, co-drive без handoff через скриншоты терминала.

Примеры Polly (параллельные суб-агенты + кросс-вендорное ревью) и Debby (дебаты двух моделей) демонстрируют оркестрацию, но не готовые enterprise-шаблоны. GEPA, cross-session MCP в roadmap — потенциал, не обещание GA.

Если ECC уже на Claude Code, связка естественна: ECC усиливает один harness (L2), Omnigent унифицирует несколько (L3). Ошибка — считать Omnigent заменой ECC; слои стекуются.

4. Сравнение: голый harness, ECC, Omnigent

Две таблицы с едиными полями — первая для ежедневных входов, вторая для оркестрации и governance.

Распространённые Agent Harness и точки входа (2026)
Инструмент Вход Исполнение Контекст Аудитория
Claude Code CLI в терминале Bash, R/W репо, суб-агенты, MCP CLAUDE.md, сжатие сессии, дерево проекта Инженеры терминала, глубокая git-интеграция
Cursor Агент в IDE / Tab Мультифайловое редактирование, терминал, браузер (по версии) .cursor/rules, Skills, @codebase Визуальные разработчики, preview diff
OpenAI Codex CLI / облачные задачи Sandbox-исполнение, длинные jobs, изменения репо AGENTS.md, пресеты окружения Стек OpenAI, пайплайны автоматизации
Omnigent Единые CLI + web + API Оборачивает harnesses выше + YAML-агенты Общая история сессий и policies между harnesses Tech leads, multi-tool команды, governance
Оркестрация: голый vs ECC vs Omnigent
Измерение Голый harness Один инструмент + ECC (L2) Усиление одного harness + Omnigent (L3) Multi-harness оркестрация
БольЛичная продуктивностьПравила, memory, quality gatesУнификация, policy, коллаборация
Стоимость сменыСмена IDE = смена harnessRules частично кросс-harnessСтрока конфига для harness/модели
Права и расходыНативные диалоги инструментаAgentShield, hook-аудитPolicy engine, spend cap, программируемое одобрение
Порог входаМинимальныйСредний (курация Skills)Высокий (alpha, self-hosting)
Cloud runnerДостаточно SSH на MacHooks запускают удалённый buildServer + клиенты на одной execution surface
Omnigent ≠ ещё один Claude Code
Он не заменяет нижний harness, а сидит сверху. Минимум один L1 (или YAML-агент) должен менять код; Omnigent решает кто, какой бюджет, нужно ли одобрение и как делить сессии.

5. Выбор по сценарию: матрица решений

Фильтр по роли полезнее сравнения звёзд на GitHub:

  • Solo full-stack, один Cursor или Claude Code: голый harness + лёгкий AGENTS.md; Omnigent избыточен.
  • Команда 2–5, смешанные harnesses: сначала ECC или внутренние rules (L2), потом Omnigent; еженедельные споры «какой агент?» — сигнал L3.
  • R&D с audit/compliance: policy Omnigent + OS sandbox ближе к доказуемому контролю, чем разрозненные prompts — но нужна alpha risk review.
  • 7×24 цифровой двойник / IM-каналы: шлюз OpenClaw vs Omnigent — OpenClaw для каналов и постоянного online, Omnigent для multi-harness coding; можно сосуществовать, модели прав разделять.
  • Тяжёлые iOS/macOS build: оркестрация harness решает «кто пишет код»; xcodebuild требует стабильный macOS runner, см. self-hosted runner GitHub Actions на облачном Mac.

Если команда держит один язык и один репозиторий, инвестируйте в дисциплину L2 до покупки L3. Если каждый спринт — новый вендор без центральной policy, Omnigent скорее пилот, чем роскошь.

6. Рекомендуемые комбинации (стекуются)

Три стека по зрелости:

  1. Минимальный solo: Claude Code или Cursor + проектный CLAUDE.md / .cursor/rules + локальный git. Без слоя оркестрации; прототипы и side projects.
  2. Командный coding: один главный harness (единый для команды) + выборочный ECC (minimal hooks) + cloud Mac runner для тестов и archive. Governance через CI и code review на L2.
  3. Лаборатория multi-harness: Omnigent Server на фиксированном Linux/macOS (или cloud Mac) + spend cap и одобрение git push + паттерн Polly «кодер + гетерогенное ревью» + web UI с ноутбука/телефона. Sandbox для tech leads, не на prod-репозитории без ревью.

Стек 2 — default для большинства продуктовых команд в 2026. Стек 3 оправдан, если вы намеренно гоняете несколько harnesses и нужны централизованные audit trails.

7. Частые ошибки

  • Omnigent только как model gateway: чистый API routing не даёт tool execution harness; ценность L3 — policy и multi-agent коллаборация.
  • Игнор alpha-риска: API, формат конфига, порты по умолчанию могут меняться; prod mainline нужен pin версии и rollback.
  • Prompt вместо policy: «не удаляй БД» размывается в длинной сессии; лимиты расходов и approval chains должны быть исполнимы.
  • Sandbox как панацея: OS sandbox снижает утечку credentials, не заменяет code review; вредные зависимости могут двигаться внутри сети.
  • ECC или Omnigent: ECC усиливает один harness; Omnigent оркестрирует несколько — многие заканчивают на L2 + L3.

8. Внедрение: 7 шагов к аудируемому multi-harness пилоту

  1. Инвентаризация: какие harnesses, аккаунты моделей и месячные spend caps реально использует команда?
  2. Границы: non-prod monorepo или fork; pilot policies без production secrets.
  3. Установка: официальный скрипт; первый запуск — проверить обнаруженные credentials моделей.
  4. Написать policies: минимум порог расходов + ручное одобрение для git push / rm -rf.
  5. Подключить harness: сначала самый знакомый (напр. Claude Code), цикл «правка теста → запуск тестов»; затем второй harness для cross-review.
  6. Зафиксировать execution node: тяжёлые jobs на macOS 24/7 (Mac mini или cloud Mac), не на спящем ноутбуке.
  7. Ретроспектива: через две недели — расходы, ложные срабатывания одобрений и коллаборация без скриншотов; иначе сузить scope или остаться на L2.

9. FAQ

В1. Agent Harness и AI Agent — одно и то же?

Нет. «Agent» обычно система, преследующая цель автономно; harness — слой исполнения и контекста. «Кодить в Claude Code» точнее: модель Claude через harness Claude Code.

В2. Связь Omnigent и Databricks?

Open source от команды Databricks (Matei Zaharia и др.), Apache 2.0; нет обязательной привязки к коммерческим продуктам Databricks. Клиенты Databricks могут интегрировать, но не обязаны.

В3. Нужен ли Cursor с Omnigent?

Да, если важен IDE-опыт. Omnigent оркестрирует возможности агента Cursor или параллельно другие harnesses; редактор не заменяет. Чисто CLI-команды: достаточно Claude Code + Omnigent.

В4. Станет ли дороже?

Может и да, и нет. Параллельные агенты повышают tokens; policies и меньше «не тот модель на тяжёлую задачу» снижают waste. В пилоте включите billing alerts.

В5. Почему так часто cloud Mac?

Harness нуждается в стабильной ОС. iOS/macOS build, подпись и notarytool требуют настоящий macOS; Omnigent Server на cloud Mac держит сессии и runner при закрытом ноутбуке — как OpenClaw и self-hosted runner.

10. Итог

Agent Harness — не маркетинговый шум, а консенсусный термин для execution-инфраструктуры за пределами модели. Claude Code, Cursor и Codex конкурируют на L1; ECC усиливает L2; Omnigent переносит битву на L3 — кто работает, сколько стоит, можно ли делить сессии и доказать цепочку одобрений?

Solo с одним инструментом — без спешки. Multi-harness команда — две недели alpha-пилота за чёткой картой оркестрации. Какой бы слой ни выбрали: дайте агенту стабильный macOS с SSH и xcodebuild — мозг в облаке, руки тоже.

Multi-harness оркестрация: execution node на cloud Mac

Когда Omnigent, Claude Code и CI идут параллельно, закрытый ноутбук обрывает длинные сессии. Hashvps bare-metal macOS M4 в Канаде, выделенный IP и низкое энергопотребление 24/7 подходят как постоянный хост для Omnigent Server и xcodebuild runner — оркестрация на L3, сборка и подпись на настоящем Apple-железе.

Планируете удалённые execution nodes для agent workflow? Cloud Mac mini M4 от Hashvps — прагматичная стартовая точка Смотреть тарифы и избежать обрывов harness из-за локального железа.

Hashvps · Mac Cloud

Cloud Mac для оркестрации Agent и CI

Bare-metal macOS, выделенный IP—Omnigent Server, Claude Code и self-hosted runner круглосуточно.

Смотреть тарифы
Акция