En juin 2026, le cofondateur de Databricks Matei Zaharia a publié Omnigent sur GitHub à la veille du Data + AI Summit ; le projet a dépassé dix mille étoiles en quelques jours. Parallèlement, l'expression Agent Harness envahit Twitter, les blogs techniques et la doc Claude Code. Beaucoup sentent que c'est « important », sans pouvoir distinguer modèle, agent et IDE.
Si vous avez Claude Code dans un terminal, Cursor Agent dans l'IDE et parfois Codex ou vos propres scripts, ce guide clarifie les concepts et aide à juger si un meta-harness comme Omnigent mérite un pilote maintenant. Site officiel : omnigent.ai ; statut : Apache 2.0, alpha — commandes et API peuvent évoluer vite, alignez le déploiement sur le quickstart du dépôt.
En bref : en 2026, la ligne de partage, c'est la couche d'orchestration, pas le classement des modèles.
-
Agent Harness = « OS » du modèle
Appels d'outils, compression de contexte, limites de permission et boucle ReAct ; Claude Code, Cursor et Codex sont des harnesses, pas des modèles.
Model + Harness
-
Omnigent = plan de contrôle au-dessus
Une ligne de config pour basculer Claude Code, Codex ou un agent YAML ; les policies gèrent coût et risque au lieu de prier le prompt.
Meta-Harness
-
Pertinent si plusieurs harnesses en parallèle
Solo avec un seul agent IDE : attendre. Équipe de trois+, fournisseurs mixtes, sessions partagées et audit : pilote alpha rentable.
Alpha · auto-hébergé
1. Pourquoi tout le monde parle de Harness en 2026
En 2025 on demandait « comment construire un agent qui code » ; en 2026 c'est « comment faire tourner cinq ou six agents sans perdre le contrôle ». Scène type : le front utilise Cursor, le lead back Claude Code en CLI, les scripts ops appellent Codex, une ligne métier a un agent de revue en YAML — ils s'ignorent, les règles sont éparpillées, la facture tokens est dans quatre consoles, et après un git push personne ne sait qui a approuvé.
La communauté résume : Agent = Model + Harness. Le modèle raisonne ; le harness rend ce raisonnement actionnable — enregistrer des outils, exécuter bash, lire/écrire des fichiers, compresser l'historique, rappeler le modèle en boucle jusqu'à la fin de la tâche. L'article Anatomy of an Agent Harness de LangChain classe prompts système, MCP, orchestration de sous-agents et middleware Hook dans l'ingénierie harness, pas dans les « astuces de prompt ».
Le vrai mal n'est pas un harness « trop bête », c'est l'absence de couche d'orchestration unifiée : changer d'outil = réécrire le flux, changer de modèle = réapprendre les règles, collaborer par captures d'écran et collage de terminal. Omnigent vise ce vide — comme Kubernetes gère des conteneurs, il gère des harnesses (formulation officielle : common orchestration layer). Cela rejoint notre panorama des modes de développement agent : le point d'entrée façonne le workflow ; changer souvent de modèle sans discipline harness/orchestration fragmente l'équipe.
Pour les équipes soumises à l'AI Act et aux audits internes, le goulot 2026 passe de « quel LLM ? » à « qui peut exécuter quoi, avec quelle preuve ? » Un meta-harness répond à cette question — pas parfaitement en alpha, mais plus structuré que des prompts dispersés.
2. Qu'est-ce qu'un Agent Harness ? Trois couches, ne pas confondre avec le modèle
Classer d'abord, choisir ensuite :
- L0 Modèle : Claude, GPT, Gemini en API ; texte ou structure tool-call, sans accès direct au disque.
- L1 Agent Harness : produit branchant le modèle sur l'environnement réel — Claude Code (CLI terminal), Cursor (agent IDE), OpenAI Codex, Pi, etc. Boucle d'exécution, dialogues de permission, injection de contexte projet.
- L2 Renfort harness : skills et règles sur un harness, ex. ECC (Everything Claude Code) avec Skills, Hooks et AgentShield — améliore comment on code, ne remplace pas le harness.
- L3 Meta-Harness / plan de contrôle : Omnigent gère plusieurs L1/L2, policies unifiées, sandbox, partage de session et accès multi-appareils (terminal, web, mobile, REST).
Thèse asymétrique : le modèle fixe le plafond, le harness le plancher ; avec plusieurs harnesses, L3 décide si le sol est plat ou miné. Débattre « Claude ou GPT » tout en laissant cinq harnesses non coordonnés est l'erreur organisationnelle la plus fréquente en 2026.
En pratique, L1 = où vous tapez (terminal, IDE, job API). L2 standardise la qualité dans cet entrée. L3 standardise qui utilise quel entrée, quand, et comment les sessions se partagent entre rôles. Sans L3, chaque harness reste un silo avec sa mémoire et ses coûts.
3. Qu'est-ce qu'Omnigent ? Quatre cartes du meta-harness open source
Selon la documentation officielle et le README GitHub, l'architecture se divise en Runner (emballer tout agent dans une session sandboxée à API unifiée) et Server (policies, historique partagé, même session exposée au terminal, UI web par défaut http://localhost:6767, bureau, mobile et REST). Installation typique :
curl -fsSL https://omnigent.ai/install.sh | sh
Quatre axes (alpha — disponibilité selon version) :
- Composition : basculer ou paralléliser Claude Code, Codex, Pi ou agent YAML dans une tâche ; changement de harness par config, pas réécriture de scripts repo.
- Governance : Contextual Policies — pause si seuil de dépense, approbation manuelle pour
git pushaprèsnpm install; plus exécutable que « ne pushez pas » dans CLAUDE.md. - Sandbox : restrictions OS sur fichiers et réseau ; secrets injectés par proxy, pas de token GitHub en clair dans l'agent (souvent bubblewrap sur Linux, Seatbelt sur macOS — voir docs sécurité du dépôt).
- Collaboration : URL de session partagée, collègues en lecture ou co-pilotage — moins de handoffs par capture de terminal.
Les agents exemple Polly (sous-agents parallèles + revue multi-fournisseur) et Debby (débat bi-modèle) illustrent l'orchestration ; ce ne sont pas des modèles enterprise prêts à l'emploi. GEPA, MCP inter-sessions sur la roadmap = potentiel, pas engagement GA.
Si vous déployez déjà ECC sur Claude Code, la combinaison est naturelle : ECC affine un harness (L2), Omnigent unifie plusieurs (L3). L'erreur serait de traiter Omnigent comme remplacement d'ECC — les couches s'empilent.
4. Comparaison centrale : harness nu, ECC, Omnigent
Deux tableaux à champs uniformes — premier pour les entrées quotidiennes, second pour orchestration et gouvernance.
| Outil | Entrée | Exécution | Contexte | Public |
|---|---|---|---|---|
| Claude Code | CLI terminal | Bash, R/W repo, sous-agents, MCP | CLAUDE.md, compression session, arbre projet | Ingénieurs terminal, intégration git profonde |
| Cursor | Agent IDE / Tab | Édition multi-fichiers, terminal, navigateur (selon version) | .cursor/rules, Skills, @codebase | Développeurs visuels, preview de diff |
| OpenAI Codex | CLI / tâches cloud | Exécution sandboxée, jobs longs, changements repo | AGENTS.md, presets d'environnement | Stack OpenAI, pipelines d'automatisation |
| Omnigent | CLI + web + API unifiés | Encapsule harnesses ci-dessus + agents YAML | Historique et policies partagés entre harnesses | Leads tech, équipes multi-outils, gouvernance |
| Dimension | Harness nu Un seul outil | + ECC (L2) Renfort mono-harness | + Omnigent (L3) Orchestration multi-harness |
|---|---|---|---|
| Douleur résolue | Productivité individuelle | Règles, mémoire, quality gates | Unification, policy, collaboration |
| Coût de changement | Changer d'IDE = changer de harness | Rules partiellement partagées | Une ligne de config harness/modèle |
| Droits & dépenses | Dialogues natifs outil | AgentShield, audit Hook | Moteur policy, plafond dépense, approbation programmable |
| Prise en main | Minimale | Moyenne (curater Skills) | Élevée (alpha, auto-hébergement) |
| Runner cloud | SSH vers Mac suffit | Hooks déclenchent build distant | Server + clients sur même surface d'exécution |
5. Choisir par scénario : matrice de décision
Filtrer par rôle bat la comparaison de stars :
- Solo full-stack, un Cursor ou Claude Code : harness nu +
AGENTS.mdléger ; Omnigent est lourd. - Équipe 2–5, harnesses mixtes : d'abord ECC ou règles internes (L2), puis évaluer Omnigent ; débats hebdo « quel agent ? » = signal L3.
- R&D avec audit/conformité : policy Omnigent + sandbox OS plus proche d'un contrôle prouvable que des prompts éparpillés — revue de risque alpha quand même.
- Jumeau 7×24 / canaux IM : passerelle OpenClaw vs Omnigent — OpenClaw pour canal et présence permanente, Omnigent pour orchestration coding multi-harness ; cohabitation possible, modèles de permission séparés.
- Build iOS/macOS intensif : l'orchestration harness résout « qui code » ;
xcodebuildexige un runner macOS stable, voir runner auto-hébergé GitHub Actions sur Mac cloud.
Si l'équipe tient un langage et un repo, investissez en discipline L2 avant d'acheter L3. Si chaque sprint teste un fournisseur sans policy centrale, Omnigent est pilote plus que luxe.
6. Combinaisons recommandées (empilables)
Trois stacks par maturité :
- Minimal solo : Claude Code ou Cursor +
CLAUDE.md/.cursor/rulesprojet + git local. Pas de couche d'orchestration ; prototypes et side projects. - Coding d'équipe : un harness principal (uniforme) + ECC sélectif (hooks minimaux) + runner Mac cloud pour tests et archives. Gouvernance via CI et code review en L2.
- Labo multi-harness : Omnigent Server sur hôte Linux/macOS fixe (ou Mac cloud) + plafond dépense et approbation
git push+ motif Polly « codeur + revue hétérogène » + UI web depuis laptop/mobile. Sandbox pour leads tech, pas sur dépôts prod sans revue.
Le stack 2 est le défaut pour la plupart des équipes produit en 2026. Le stack 3 vaut le coup si vous exploitez délibérément plusieurs harnesses et avez besoin de traces d'audit centralisées.
7. Erreurs fréquentes
- Omnigent comme simple passerelle modèle : le routage API seul n'apporte pas l'exécution harness ; la valeur L3 est policy et collaboration multi-agent.
- Ignorer le risque alpha : APIs, format config, ports par défaut peuvent changer ; la ligne prod principale exige pin de version et rollback.
- Prompt à la place de policy : « ne supprime pas la DB » s'efface en longue session ; plafonds et chaînes d'approbation doivent être exécutables.
- Sandbox miracle : la sandbox OS réduit les fuites de credentials, ne remplace pas la revue de code ; dépendances malveillantes peuvent se déplacer en interne.
- ECC ou Omnigent : ECC renforce un harness ; Omnigent orchestre plusieurs — beaucoup finissent en L2 + L3.
8. Déploiement : 7 étapes vers un pilote multi-harness auditable
- Inventaire : quels harnesses, comptes modèle et plafonds mensuels l'équipe utilise réellement ?
- Limites : monorepo ou fork non prod ; policies pilote sans secrets production.
- Installation : script officiel ; premier run : vérifier que les credentials modèle détectés sont corrects.
- Écrire des policies : au minimum seuil de dépense + approbation manuelle pour
git push/rm -rf. - Brancher un harness : d'abord le plus familier (ex. Claude Code), boucle « modifier test → lancer tests » ; puis second harness pour revue croisée.
- Fixer le nœud d'exécution : jobs lourds sur macOS 24h (Mac mini ou Mac cloud), pas laptop en veille.
- Rétrospective : après deux semaines, coûts, faux positifs d'approbation et collaboration sans capture ; sinon réduire le scope ou rester en L2.
9. FAQ
Q1. Agent Harness et agent IA, c'est pareil ?
Non. « Agent » désigne souvent le système autonome vers un objectif ; le harness est la couche d'exécution et de contexte. « Coder avec Claude Code » veut dire : modèle Claude via le harness Claude Code.
Q2. Lien entre Omnigent et Databricks ?
Open source par l'équipe Databricks (Matei Zaharia et al.), licence Apache 2.0 ; pas d'obligation vers les produits commerciaux Databricks. Les clients Databricks peuvent intégrer, ce n'est pas un prérequis.
Q3. Faut-il encore Cursor avec Omnigent ?
Oui si l'expérience IDE compte. Omnigent orchestre les capacités agent de Cursor ou d'autres harnesses en parallèle ; il ne remplace pas l'éditeur. Équipes CLI seules : Claude Code + Omnigent suffit.
Q4. Est-ce plus cher ?
Peut-être les deux. Agents parallèles augmentent les tokens ; policies et moins de « mauvais modèle pour gros job » réduisent le gaspillage. Alertes facturation pendant le pilote.
Q5. Pourquoi tant de Mac cloud dans le texte ?
Le harness a besoin d'un OS stable. Build iOS/macOS, signature et notarytool exigent un vrai macOS ; Omnigent Server sur Mac cloud garde sessions et runner quand le laptop est fermé — comme OpenClaw et runner auto-hébergé.
10. Conclusion
Agent Harness n'est pas du jargon marketing mais le terme consensuel pour l'infrastructure d'exécution au-delà du modèle. Claude Code, Cursor et Codex rivalisent en L1 ; ECC affine L2 ; Omnigent déplace le combat en L3 — qui travaille, combien ça coûte, peut-on partager les sessions et prouver les approbations ?
Solo avec un outil : pas d'urgence. Équipe multi-harness : deux semaines de pilote alpha pour une carte d'orchestration claire. Quelle que soit la couche : donnez à l'agent un macOS stable, SSH et xcodebuild — cerveau dans le cloud, mains aussi.
Orchestration multi-harness : nœud d'exécution sur Mac cloud
Omnigent, Claude Code et CI en parallèle : un laptop fermé coupe les longues sessions. Hashvps Mac cloud M4 bare metal au Canada, IP dédiée et faible consommation 24/7 conviennent comme hôte fixe pour Omnigent Server et runner xcodebuild — orchestration en L3, build et signature sur vrai matériel Apple.
Vous planifiez des nœuds d'exécution distants pour workflows agent ? Le Mac cloud mini M4 Hashvps est un point de départ pragmatique — Voir les offres et éviter les coupures harness liées au matériel local.