Выбор Agent в 2026: сначала парадигма оркестрации и архитектура, затем фреймворк и модель. Парадигма важнее модели; продакшен → LangGraph, Claude → SDK, прототип → CrewAI. Long-running требует Dedicated Host. Железное правило: LLM → один Agent → multi-agent только по необходимости — без пропуска уровней.
1. Пять трендов: поворот от эксперимента к продакшену
В первой половине 2026 в сфере Agent одновременно происходят пять структурных сдвигов. Они формируют frontier-панораму и объясняют, почему старые гиды (сравнение только моделей или IDE-плагинов) больше не работают. Для команд с требованиями к аудиту и безопасности узкое место смещается от выбора модели к governance-слою.
1.1 Протокольный слой: MCP + A2A
MCP (Model Context Protocol) и протокол A2A (Agent-to-Agent) находятся под управлением Linux Foundation и становятся de-facto стандартом кросс-вендорной совместимости. Интеграция инструментов переходит от «SDK на каждого вендора» к «подключи MCP Server» — стоимость интеграции стремится к нулю, но sandbox безопасности и аудит прав на стороне host становятся узким местом.
1.2 Слой reasoning: Extended Thinking и CoT
Extended Thinking — стандарт у Claude, OpenAI и других; Chain-of-Thought опускается с prompt-слоя в архитектуру модели. Инженерный смысл: меньше промптов «думай шаг за шагом», больше конечных автоматов и checkpoint. Оркестрация должна принимать более длинные промежуточные состояния.
1.3 Слой оркестрации: четыре парадигмы
Графовая, ролевая, handoff и иерархическая парадигмы сосуществуют; конкуренция фреймворков смещается к экосистеме и полноте toolchain, а не к спискам фич. В корпоративном продакшене LangGraph + LangSmith занимает первое место — см. раздел 3.
1.4 Рост long-running Agent
Жизненный цикл меняется с «диалог → конец» на «постоянный heartbeat»: OpenClaw Gateway работает 7×24. Главное препятствие — не модель, а загрязнение памяти, злоупотребление правами и персистентность процессов — нужен Dedicated Host, не ноутбук разработчика (раздел 5).
1.5 Computer Use и слой восприятия
Agent напрямую управляет GUI: Anthropic Computer Use API и Claude in Chrome делают браузер runtime-средой. Бенчмарки WebArena показывают значительный запас для улучшения надёжности — OS- и browser-уровни решают разные задачи (раздел 6).
2. Четыре парадигмы оркестрации: фреймворки и сценарии 2026
Перед фреймворком — выбор парадигмы. Она определяет поток управления, хранение состояния и командную работу — смена парадигмы дороже смены API модели.
2.1 Графовая — корпоративный продакшен
Определение: поток управления как ориентированный граф; узлы — agent, tool или checkpoint, рёбра — условные переходы. Представители: LangGraph (v0.4, ~85K stars), Microsoft Agent Framework. Применение: сложные stateful workflow, регуляторный compliance, точный audit и rollback. Персистентность состояния встроена; с LangSmith — полная observability toolchain.
2.2 Ролевая — самый быстрый прототип
Определение: метафора «членов команды» с role, goal, backstory. Представители: CrewAI (community ~44,6K stars, Enterprise для Fortune 500), Agno. Применение: быстрые прототипы, прямое отображение бизнес-ролей, логика, понятная не-инженерам. Самая низкая кривая обучения, но слабее checkpoint и prod-готовность, чем у LangGraph.
2.3 Handoff — низкое трение GPT-стека
Определение: явная передача контроля между agents с состоянием задачи. Представитель: OpenAI Agents SDK (major release 2026.4, нативный MCP). Применение: проекты GPT-стека, ясные single-chain flow, минимальные затраты на интеграцию. Привязка к OpenAI; prod-готовность ~2,5 звезды с встроенным tracing и guardrails.
2.4 Иерархическая — GCP / Gemini / A2A
Определение: корневой agent рекурсивно делегирует дерево sub-agent, как оргструктура. Представитель: Google ADK (2025.4, A2A-натив, Vertex AI). Применение: экосистема GCP, Gemini мультимодал, кросс-фреймворковый A2A. Относительно нов; prod-готовность ~1 звезда — для GCP-native пилотов, не универсальный default.
3. Сравнение по семи измерениям (2026 Q2)
Пять ведущих фреймворков в единой сетке — данные Q2 2026; возможности быстро эволюционируют, перед выбором сверяйтесь с официальными changelog.
| Фреймворк | Парадигма | Персистентность | Зависимость от модели | Кривая обучения | Prod-готовность | Лучше всего для |
|---|---|---|---|---|---|---|
| LangGraph v0.4 | Графовая | Встроенный checkpoint | Модель-независим | Средняя (концепт графа) | ★★★ toolchain LangSmith | Сложные stateful-приложения, compliance |
| Claude Agent SDK | Toolchain + sub-agent | MCP Server | Только Claude | Средняя | ★★★ security-first | Нативный Anthropic, автоматизация кода |
| CrewAI Enterprise | Ролевая | Ограничена | Модель-независим | Низкая | ★★ ограниченные checkpoint | Быстрые прототипы, mapping ролей |
| OpenAI Agents SDK | Handoff | Контекстные переменные | Только OpenAI | Низкая | ★★☆ tracing + guardrails | GPT-стек, низкое трение |
| Google ADK | Иерархическая | Session + plugins | Оптимизирован под Gemini | Средняя (контекст GCP) | ★ новый, поддержка GCP | Экосистема GCP, мультимодал, A2A |
4. Long-running Agent: heartbeat vs request-response
В 2026 runtime расходится: классический режим = запрос → однократное исполнение → результат → завершение процесса (гранулярность: один запрос); long-running = heartbeat (таймер/событие) → список задач → подзадачи → обновление состояния → следующий heartbeat (гранулярность: одна цель, часы–дни, HITL при необходимости решения человека).
OpenClaw Gateway, удалённый host Claude Code и cron-agent команды относятся к этой категории. Инженерные требования:
- Dedicated Host всегда онлайн: ноутбук засыпает → heartbeat останавливается; SSH на Cloud Mac / Mac mini (см. слой исполнения Agent Cloud Mac).
- Изоляция состояния и памяти: персистентный workspace volume + стратегия очистки против загрязнения памяти.
- Минимальные права: launchd/systemd + audit hooks; OpenClaw gateway порт 18789 — типичная attack surface.
5. Computer Use: уровень OS vs браузер
Computer Use позволяет agent управлять ПО как человек. Два основных пути в 2026 — выбор зависит от наличия API и возможности DOM-парсинга.
| Критерий | Уровень OS Скриншот + vision | Уровень браузера DOM / Playwright |
|---|---|---|
| Принцип работы | Скриншот → понимание → клавиатура/мышь → цикл | Parse DOM → управление на уровне кода |
| Представители | Anthropic Computer Use, Claude in Chrome | Playwright+LLM, Browserbase, Stagehand |
| Подходит для | Desktop-приложения, внутренние системы без API | Web-автоматизация, сбор данных |
| Скорость/стоимость | Медленно, высокие token на скриншоты | Быстро, дёшево, точно |
| Риск | Строгий sandbox, изолированный host | Сложные сайты: нужен HOTL |
6. Полное дерево решений
Первые пять разделов сведены в walkthrough-дерево — можно проецировать на командный workshop.
6.1 Уровень 1: нужен ли agent для задачи?
Нет → достаточно одного LLM-вызова или простой chain, без over-engineering. Да → уровень 2.
6.2 Уровень 2: хватит ли одного agent?
Да → sequential, ReAct или HITL-цикл. Нет → multi-agent: orchestrator, router, debate, swarm — upgrade только если single agent + MCP-инструменты реально не хватает.
6.3 Уровень 3: mapping фреймворков
- Точный поток / compliance / audit → LangGraph
- Нативный Claude / автоматизация кода → Claude Agent SDK
- Быстрый прототип / mapping ролей → CrewAI
- GPT-стек / низкое трение → OpenAI Agents SDK (2026.4)
- GCP / Gemini / мультимодал / A2A → Google ADK
Красная линия на всех уровнях: необратимые операции и высокий риск → HITL обязателен; EU AI Act ст. 14 → human-in-the-loop. Не переходить к multi-agent, минуя архитектурные уровни.
7. Путь доверия: HITL → OOTL
Может ли agent быть «полностью автономным» — зависит от стоимости ошибки и обратимости, а не от силы модели. Четыре фазы в 2026 — доверие зарабатывается, не декларируется.
- Фаза 1 HITL: одобрение каждого шага, baseline 1–4 недели. Для всех новых проектов.
- Фаза 2 HOTL: мониторинг + вмешательство при аномалиях, 1–3 месяца. Computer Use и long-running остаются здесь, пока error rate не измерен.
- Фаза 3 low-risk OOTL: полная автономия в sandbox, 3–12 месяцев. Read-only, документы, изолированные тесты.
- Фаза 4 core OOTL: в 2026 для большинства команд ещё рано — платежи, prod-deploy, необратимые изменения данных.
8. Слой исполнения: выбор host
Фреймворк отвечает на «как оркестрировать»; Dedicated Host — на «где исполнять». Три класса нагрузки с жёсткими требованиями:
| Нагрузка | Требование к host | Рекомендация |
|---|---|---|
| Claude Code / CLI coding agent | Персистентный shell, git, опционально Xcode | Cloud Mac M4 Dedicated Host |
| Heartbeat OpenClaw Gateway | 7×24, launchd, loopback/Tailnet | Постоянный узел Cloud Mac (Канада) |
| LangGraph prod + CI | Внешний state store; изоляция build | Cloud Mac Runner + self-hosted runner GH Actions |
| OS Computer Use | GUI sandbox, изоляция скриншотов | Отдельный Cloud Mac, не daily driver |
| Браузерная автоматизация | Playwright, Chrome headless | Linux VM или Cloud Mac |
9. Рекомендуемые стеки
Stack A: корпоративный продакшен (compliance)
- Оркестрация: LangGraph + observability LangSmith
- Модель: два поставщика Claude / GPT
- Инструменты: whitelist MCP Server
- Host: Dedicated Cloud Mac + отдельный runner (CI)
- Доверие: HITL → HOTL, без скачка к OOTL
Stack B: команды нативной разработки на Claude
- Оркестрация: Claude Agent SDK + ECC Harness
- Вход: Claude Code CLI + Cursor IDE параллельно
- Host: удалённый Cloud Mac SSH host
- Доверие: worktree-изоляция + PR review (HITL)
Stack C: быстрая валидация / бизнес-прототип
- Оркестрация: CrewAI ролевая
- Модель: одна API, диверсификация после стабилизации flow
- Host: локальный пилот → Cloud Mac за 2 недели
- Доверие: постоянный HITL, без маркетинга «автономный agent»
10. Частые ошибки
- Пропуск дерева, сразу multi-agent: в 90 % случаев хватает single agent + MCP.
- CrewAI-прототип как есть в прод: слабые checkpoint — миграция на LangGraph или внешний state machine.
- Long-running на ноутбуке: heartbeat прерывается при сне; gateway требует Dedicated Host.
- Computer Use без sandbox: OS screenshot agent с высоким риском ошибочного клика — изолированный host + HOTL.
- Декларация OOTL вместо заслуживания: без данных error rate — риск compliance и репутации.
11. Внедрение в семь шагов
- Дерево уровень 1: подтвердить, что нужен agent, а не простой LLM-вызов.
- Зафиксировать парадигму: prod compliance → граф; прототип → роли; GPT-стек → handoff.
- Фреймворк + таблица семи измерений: один основной фреймворк, список MCP ≤ 10 инструментов.
- Развернуть Dedicated Host: macOS-цепочка → Cloud Mac; чистый web → Linux возможен.
- Холодный старт HITL: одобрение каждого шага 1–4 недели, фиксировать error rate.
{
"remote": {
"host": "cloud-mac.example.com",
"user": "agent",
"identityFile": "~/.ssh/team_agent_ed25519"
}
}
- Оценить long-running / Computer Use: cron heartbeat + sandbox; браузер предпочтительнее OS-уровня.
- Data-driven upgrade к HOTL: error rate ниже порога → расширить автономию; core OOTL 2026 по умолчанию: нет.
FAQ
Q1: Какой фреймворк для корпоративного продакшена в 2026?
Точный поток, checkpoint, audit, LangSmith → LangGraph. Автоматизация кода на Claude → Claude Agent SDK параллельно. CrewAI для прототипов, не для ядра продакшена.
Q2: OpenAI Agents SDK 2026.4 — стоит ли мигрировать?
Уже в GPT-стеке с handoff single-chain → да, нативный MCP и tracing сокращают glue code. Уже LangGraph с multi-model → нет, привязка к OpenAI — жёсткое ограничение.
Q3: Long-running обязательно требует Cloud Mac?
Не обязательно Mac — чистые Linux agent на cloud VM. При Xcode, Keychain, macOS Computer Use или OpenClaw с Apple toolchain Cloud Mac — Dedicated Host с минимальным трением в 2026.
Q4: Lock-in после стандартизации MCP + A2A?
Lock-in на уровне инструментов снижается; парадигма оркестрации и модель состояния остаются. Граф LangGraph в роли CrewAI — практически переписывание с нуля.
Q5: Когда core OOTL?
Ответ 2026 по умолчанию: нет. Только при полностью обратимых ошибках, автоматизированном rollback и ≥ 12 месяцев данных HOTL — плюс требования EU AI Act human-in-the-loop.
Итог
Frontier-панорама 2026 в трёх слоях: тренды (протокол, reasoning, long-running, Computer Use) → парадигмы (граф / роли / handoff / иерархия) → доверие (HITL → HOTL → осторожный OOTL). Порядок: дерево решений → таблица семи измерений → Dedicated Host → data-driven автономия. Железное правило: начинать с простого, upgrade по необходимости; парадигма важнее модели, путь доверия важнее списка фич.
Cloud Mac: база исполнения для long-running Agent и Claude SDK
Оркестрация LangGraph, исполнение Claude Agent SDK, heartbeat gateway OpenClaw — три стека 2026 с одинаковыми инфра-требованиями: 7×24 онлайн, SSH, полная macOS toolchain. Cloud Mac mini M4 даёт настоящее железо Apple, launchd-friendly среду и выделенный IPv4; long-running продолжает работу в дата-центре, sandbox Computer Use изолирован от daily driver; низкое энергопотребление M4 подходит для постоянных heartbeat.
От прототипа CrewAI к prod LangGraph или при развёртывании Claude SDK + OpenClaw long-running: Hashvps Cloud Mac mini M4 — точка входа с минимальным трением на слое исполнения — смотреть тарифы и запускайте heartbeat на стабильном host, а не на засыпающем ноутбуке.