Agent Harness가 헷갈리나요? 화제의 Omnigent 완전 정리 (2026)

2026년 6월, Databricks 공동창업자 Matei Zaharia가 Data + AI Summit 직전에 Omnigent를 GitHub에 공개했고, 며칠 만에 star가 1만을 넘겼다. 동시에 「Agent Harness」라는 말이 Twitter, 기술 블로그, Claude Code 문서에서 자주 등장한다——중요하다는 건 알지만, 모델·Agent·IDE와 무엇이 다른지 설명 못 하는 사람이 많다.

왼손에 Claude Code, 오른손에 Cursor Agent, 가끔 Codex나 자작 스크립트를 쓴다면, 이 글로 개념을 정리하고 Omnigent 같은 meta-harness(메타 하네스 층)에 지금 탈 가치가 있는지 판단할 수 있다. 공식: omnigent.ai. 프로젝트는 Apache 2.0 오픈소스·alpha 단계——명령과 API는 빠르게 바뀔 수 있다. 실제 도입은 저장소 quickstart를 기준으로 할 것.

결론 선행: 2026년 AI 프로그래밍의 분수령은오케스트레이션 층에 있으며, 모델 순위가 아니다.

Agent Harness = 모델의 「OS」

도구 호출, 컨텍스트 압축, 권한 경계, ReAct 루프를 담당한다. Claude Code, Cursor, Codex는 모두 Harness이지 모델 자체가 아니다.

Model + Harness
Omnigent = Harness 위의 컨트롤 플레인

한 줄 설정으로 Claude Code / Codex / 커스텀 YAML Agent 전환. Policy로 비용과 리스크를 관리——prompt에 기도하지 않는다.

Meta-Harness
적합: 다중 Harness 병행 팀

혼자 IDE Agent 하나만 쓰면 관망해도 된다. 3인 이상, 모델 벤더 혼용, 공유 세션과 감사가 필요한 팀은 alpha 시험이 가치 있다.

Alpha · 셀프호스트

1. 왜 2026년 모두 Harness를 말하는가

2025년 질문은 「코드를 쓸 수 있는 Agent를 어떻게 만들까」. 2026년은 「다섯여섯 개 Agent를 동시에 돌려도 통제하려면」. 전형: 프론트는 Cursor, 백엔드 책임자는 Claude Code CLI, 운영 스크립트에 Codex, 어떤 사업선은 YAML 정의 리뷰 Agent——서로 존재를 모르고, 규칙도 제각각, Token 청구는 콘솔 네 곳에 분산, git push를 누가 승인했는지 아무도 설명 못 한다.

LangChain 등 커뮤니티 공식은 명확하다: Agent = Model + Harness. 모델은 추론; Harness는 「추론이 손을 움직이게」——도구 등록, bash 실행, 파일 I/O, 히스토리 압축, 루프 안 반복 모델 호출. LangChain Harness 해부 글은 시스템 프롬프트, MCP, 하위 Agent 편성, Hook 미들웨어를 모두 Harness 엔지니어링으로 보며 「프롬프트 요령」이 아니다.

진짜 아픈 건 개별 Harness의 똑똑함이 아니라 통일 오케스트레이션 층 부재——도구를 바꿀 때마다 플로우 재작성, 모델을 바꿀 때마다 규칙 재교육, 협업은 스크린샷과 터미널 붙여넣기. Omnigent가 메우려는 공백이 바로 이것——Kubernetes가 컨테이너를 묶듯, 여러 Harness를 위에서 묶는다(공식 표현: common orchestration layer). 이는 사이트 Agent 개발 모드 전면과 선택 가이드의 「진입점이 워크플로를 결정한다」와 일치: 모델을 아무리 바꿔도 Harness와 편성 층이 안 바뀌면 팀은 여전히 파편화된다.

2. Agent Harness란: 3계층 분류, 모델과 혼동 금지

먼저 층을 나눠 두자——이후 선택이 안 흔들린다:

L0 모델(Model): Claude, GPT, Gemini 등 API. 텍스트나 tool-call 구조만 반환하며 디스크에 직접 닿지 않는다.
L1 Agent Harness: 모델을 실환경에 연결하는 제품——Claude Code(터미널 CLI), Cursor(IDE Agent 모드), OpenAI Codex, Pi 등. 실행 루프, 권한 프롬프트, 프로젝트 컨텍스트 주입을 구현한다.
L2 Harness 확장 팩: 단일 Harness 위 스킬과 규칙. 예: ECC (Everything Claude Code)의 Skills, Hooks, AgentShield——「어떻게 쓸지」를 강화하며 Harness 자체를 대체하지 않는다.
L3 Meta-Harness / 컨트롤 플레인: Omnigent가 있는 층. 여러 L1/L2를 관리하고 정책·샌드박스·세션 공유·다단말(터미널, Web, 모바일, REST)을 통일한다.

비대칭 결론 재확인: 모델 능력은 천장, Harness는 바닥; 다중 Harness 공존 시 바닥 높낮이는 L3 편성 층 유무에 달린다. 「Claude와 GPT 중 누가 더 강한가」만 논하고 다섯 Harness를 각자 돌리는 것은 2026년 가장 흔한 조직 차원의 실패다.

Omnigent는 최상층——Claude Code나 Cursor를 대체하지 않고 통일 스케줄한다

3. Omnigent란: 오픈소스 meta-harness의 네 장의 카드

공식 소개와 GitHub README에 따르면 Omnigent 핵심은 둘: Runner가 임의 Agent를 샌드박스화·API 통일 세션으로 감싼다; Server가 정책과 공유 히스토리를 관리하고 동일 세션을 터미널, Web UI(로컬 기본 http://localhost:6767), 데스크톱, 모바일, REST API에 노출한다. 설치는 보통 한 줄:

Omnigent 설치（공식 install.sh 기준）

curl -fsSL https://omnigent.ai/install.sh | sh

주목할 네 가지 역량(alpha 단계, 버전별 가용성 변동):

컴포지션(Composition): 동일 작업에서 Claude Code, Codex, Pi, YAML 커스텀 Agent 전환 또는 병렬. 설정 변경으로 Harness 교체, 저장소 스크립트 재작성 불필요.
거버넌스(Governance): Contextual Policies——누적 비용 임계 초과 시 일시 정지, npm install 후 git push는 수동 승인 등. 「CLAUDE.md에 push 하지 말라」보다 실행 가능하다.
샌드박스(Sandbox): OS 수준에서 파일시스템과 네트워크 제한. 민감 자격증명은 프록시 주입, Agent는 GitHub Token 평문을 직접 보유하지 않음(Linux bubblewrap, macOS Seatbelt 등, 저장소 보안 문서 참고).
협업(Collaboration): 세션 URL 공유, 동료가 옆에서 보거나 co-drive——「터미널 스크린샷식」 인수인계를 줄인다.

내장 샘플 Agent Polly(병렬 하위 Agent + 크로스 벤더 Review)와 Debby(듀얼 모델 토론)는 편성 능력 데모이지 기업용 템플릿이 아니다. 로드맵의 GEPA 자동 최적화, 크로스 세션 MCP 등은 미 GA——「약속」이 아니라 「잠재력」으로 평가할 것.

4. 핵심 비교: 맨 Harness, ECC, Omnigent 선택법

아래 두 표는 필드를 통일해 팀 내 언어를 맞춘다. 첫째는 「일상 개발 진입점」, 둘째는 「편성과 거버넌스」.

주요 Agent Harness와 진입점 비교（2026）
도구	진입점	실행 능력	컨텍스트	적합 대상
Claude Code	터미널 CLI	bash, 저장소 I/O, 하위 Agent, MCP	CLAUDE.md, 세션 압축, 프로젝트 트리	터미널파, 깊은 git 연동이 필요한 엔지니어
Cursor	IDE 내 Agent / Tab	다중 파일 편집, 터미널, 브라우저(버전별)	.cursor/rules, Skills, @codebase	시각형 개발자, GUI와 diff 미리보기 선호
OpenAI Codex	CLI / 클라우드 작업	샌드박스 실행, 장기 작업, 저장소급 변경	AGENTS.md, 환경 프리셋	OpenAI 생태계, 자동화 파이프라인 쪽
Omnigent	통합 CLI + Web + API	위 Harness 래핑 + 커스텀 YAML Agent	Harness 간 공유 세션 히스토리와 정책	다중 도구 병행, 강한 거버넌스가 필요한 기술 책임자

편성층 선택: 맨 이용 vs ECC vs Omnigent
차원	맨 Harness 단일 도구 그대로	+ ECC（L2） 단일 Harness 강화	+ Omnigent（L3） 다중 Harness 편성
해결하는 고통	개인 효율	규칙 통일, 기억, 품질 게이트	다도구 통합, 정책, 협업
전환 비용	IDE 바꾸면 Harness도 바뀜	Claude Code/Cursor 간 Rules 동기화 가능	설정 한 줄로 Harness/모델 전환
권한과 비용	각 도구 확인 대화상자	AgentShield, Hook 감사	Policy 엔진, 비용 상한, 프로그램 승인
학습 비용	최저	중（Skills 다듬기 필요）	높음（alpha, 셀프호스트 이해）
클라우드 Runner	Mac에 SSH로 가능	Hook으로 원격 빌드 트리거	Server 배치 후 다단말이 동일 실행 환경 연결

Omnigent ≠ 또 하나의 Claude Code

하위 Harness를 대체하지 않는다——위에 앉는다. 코드를 실제로 쓰는 L1(또는 YAML 자체 Agent)은 최소 하나 필요하다. Omnigent가 관리하는 것은 「누가 할지, 얼마나 드는지, 사람 승인이 필요한지, 세션을 어떻게 공유할지」다.

5. 시나리오별 선택: 결정 매트릭스

역할로 빠르게 분류——star 수 비교보다 실용적이다.

개인 풀스택, Cursor 또는 Claude Code만: 맨 Harness + 간결한 AGENTS.md로 충분. Omnigent는 과하다.
소규모 팀 2–5인, Harness 불통일: 먼저 ECC 또는 사내 Rules(L2) 통일 후 Omnigent 평가. 매주 「어떤 Agent 쓸까」 회의면 L3 파일럿 가치 있다.
감사·컴플라이언스가 필요한 R&D 센터: Omnigent Policy + OS 샌드박스는 흩어진 prompt보다 증명 가능한 통제에 가깝다——다만 alpha 리스크 평가는 필수.
7×24 개인 분신 / IM 채널: OpenClaw Gateway와 Omnigent 역할 분담을 본다——전자는 Channel과 상시 온라인, 후자는 다중 Harness 코딩 편성. 공존 가능하나 권한 모델을 섞지 말 것.
iOS/macOS 빌드 heavy: Harness 편성은 「누가 코드를 쓰는가」; xcodebuild는 안정 macOS Runner가 필요하다. GitHub Actions 셀프호스트 macOS Runner와 클라우드 Mac 참고.

6. 권장 스택（중첩 가능）

성숙도 순 검증된 스택 세 가지:

극간 개인 스택: Claude Code 또는 Cursor + 프로젝트급 CLAUDE.md / .cursor/rules + 로컬 git. 편성층 제로. 프로토타입과 부업에 적합.
팀 코딩 스택: 메인 Harness 하나로 통일(권장) + ECC 선택 도입(minimal Hook) + 클라우드 Mac Runner로 테스트와 Archive. 편성은 L2, 거버넌스는 CI와 Code Review.
다중 Harness 실험 스택: 고정 Linux/macOS 호스트(또는 클라우드 Mac)에 Omnigent Server + Policy로 비용과 git push 제한 + Polly식 「코딩 Agent + 이종 Review Agent」 + 노트/스마트폰에서 Web UI 관람. 기술 책임자 샌드박스용——미검토로 프로덕션 저장소에 연결하지 말 것.

7. 흔한 오해

Omnigent를 모델 게이트웨이만으로 본다: API 전달만으로는 Harness급 도구 실행을 얻지 못한다. L3 가치는 정책과 다중 Agent 협업이지 저렴한 모델 교체가 아니다.
alpha 리스크 경시: API, 설정 형식, 기본 포트는 바뀔 수 있다. 프로덕션 주선은 버전 고정과 롤백 계획을.
prompt로 Policy 대체: 「DB 지우지 마」는 긴 세션에서 씻긴다. 비용 상한과 승인 체인은 실행 가능한 정책에 써야 한다.
샌드박스 만능론: OS 샌드박스는 자격증명 유출 확률을 낮추지만 코드 리뷰 대체가 아니다. 악의적 의존성은 내부망 횡이동할 수 있다.
ECC와 이분법: ECC는 단일 Harness SOP 강화; Omnigent는 다중 Harness 관리——많은 팀이 결국 L2 + L3를 겹친다.

8. 롤아웃 단계: 감사 가능한 다중 Harness 시험장 7단계

재고 조사: 팀이 실제 쓰는 Harness, 모델 계정, 월 비용 상한을 나열한다.
경계 설정: 비프로덕션 monorepo나 fork로 파일럿. 프로덕션 키 기본 접근 금지.
설치: 공식 스크립트로 Omnigent 도입. 첫 실행 시 자동 감지된 모델 자격증명이 의도와 맞는지 확인.
Policy 작성: 최소 2조——누적 Token/비용 임계 시 일시 정지; git push / rm -rf 류는 수동 승인.
Harness 연결: 가장 익숙한 것(예: Claude Code)부터. 「단위 테스트 수정 → 테스트 실행」 폐루프를 통과한 뒤 두 번째를 교차 Review용으로 연결.
실행 노드 고정: 무거운 작업은 24h 온라인 macOS(로컬 Mac mini 또는 클라우드 Mac)로. 노트북 덮개로 긴 세션 중단을 피한다.
회고: 2주 후 세 가지——비용 통제됐는가, 승인이 효율을 죽이지 않았는가, 동료가 스크린샷 없이 협업했는가. 하나라도 불합격이면 Scope 축소 또는 L2로 복귀.

9. 자주 묻는 질문

Q1. Agent Harness와 AI Agent는 같은가?

아니다. Agent는 보통 「자율적으로 목표를 달성하는 시스템」; Harness는 그중 실행과 컨텍스트 관리를 담당하는 소프트웨어 층이다. 구어의 「Claude Code로 코드 쓴다」는 정확히는 「Claude Code Harness로 Claude 모델을 돌린다」다.

Q2. Omnigent와 Databricks 관계는?

Databricks 팀이 오픈소스로 공개(Matei Zaharia 등), Apache 2.0 라이선스. Databricks 상용 제품 강제 바인딩 없음——자체 모델과 인프라로 가능. Databricks 데이터 플랫폼 이용 기업에는 통합이 가점이지만 전제는 아니다.

Q3. Omnigent 설치하면 Cursor 불필요?

IDE 경험이 필요하면 필요하다. Omnigent는 Cursor 뒤 Agent 능력을 편성하거나 다른 Harness와 병렬한다——Cursor 에디터 자체는 대체하지 않는다. 순 CLI 팀은 Claude Code + Omnigent만으로도 된다.

Q4. 비용이 더 드나?

줄 수도 늘 수도 있다. 다중 Agent 병렬은 Token 소비를 올리지만, Policy 비용 상한과 「무거운 일을 잘못된 모델에 시키는」 낭비는 줄인다. 파일럿에서는 반드시 청구 알림을 켜라.

Q5. 왜 본문에서 클라우드 Mac을 자주 언급하나?

Harness는 안정 OS 위에 올라간다. iOS/macOS 빌드, 서명, notarytool은 진짜 macOS만 가능. Omnigent Server를 클라우드 Mac에 두면 노트북 덮개 후에도 세션과 Runner가 온라인——OpenClaw, GitHub Actions 셀프호스트 Runner와 같은 「실행 노드」 문제다.

10. 정리

Agent Harness는 마케팅 용어가 아니라 2026년 엔지니어링계가 「모델 밖 실행 인프라」에 붙인 공통 이름이다. Claude Code, Cursor, Codex는 L1 경험을 겨루고; ECC는 L2를 강화한다; Omnigent는 L3로 전선을 옮긴다——누가 할지, 얼마인지, 세션 공유 가능한지, 승인 체인을 증명할 수 있는지.

혼자 단일 도구면 조급할 필요 없다. 다중 Harness 팀은 2주 alpha 시험으로 「편성층」 지도를 얻을 가치가 있다. 어떤 층을 고르든 Agent에게 안정·SSH 가능·xcodebuild가 도는 macOS를——뇌가 클라우드여도 손도 클라우드에.