Akshay analisa a arquitetura em 6 camadas do Claude Code: o modelo é apenas um nó dentro de um loop

ChainNewsAbmedia

2026-05-11 14:25:46

O engenheiro de IA Akshay Pachaar publicou no X, em 10 de maio, um diagrama completo da arquitetura do Claude Code, destacando que todo o sistema é decomposto em 6 camadas e que “o modelo é apenas um dos nós dentro de um loop”. A postagem de Pachaar cita seu ensaio longo de 6 de abril, “The Anatomy of an Agent Harness”, e o ponto principal é: o motivo de o Claude Code “parecer mágica” não é o próprio modelo, mas o design meticuloso do harness.

6 camadas de arquitetura: o modelo é apenas um nó

Pachaar organizou o Claude Code em 6 camadas:

Input Layer（camada de entrada）：responsável por gerenciamento de session, controle de permissões e configurar níveis de confiança via YAML. Qualquer instrução que entra no modelo passa primeiro por esta camada.

Knowledge Layer（camada de conhecimento）：inclui skill registry, context compressor (compactação em 3 camadas, gatilho por limiar de 92%), task graph e armazenamento de memórias entre sessões. Aqui é onde existe a “inteligência” do harness, fora dos pesos do modelo.

Execution Layer（camada de execução）：dispara chamadas de ferramentas via typed registry; cada ferramenta tem um handler — bash, read, write, grep, glob, revert. O runtime de streaming oferece suporte a execução paralela; o prompt cache reaproveita prefixos estáveis, reduzindo os custos para 10%.

Integration Layer（camada de integração）：o MCP runtime conecta servidores externos (filesystem, git e ferramentas personalizadas). As ferramentas se registram por dentro, e a memória é gravada por fora em agent_memory.md.

Multi-Agent Layer（camada de multiagentes）：inclui subagent spawner, teammate mailboxes com comunicação via redis pub/sub, protocolo de máquina de estados finitos (IDLE→REQUEST→WAIT→RESPOND), autonomous board com travas atômicas, e isolamento por worktree (cada tarefa em um branch git independente).

Observability Layer（camada de observabilidade）：envolve a barra de eventos que reúne acontecimentos de todas as camadas e lifecycle hooks; o executador em segundo plano roda de forma não bloqueante com daemon thread.

No centro está o “master agent loop” (loop do agente mestre): percepção → ação → observação. A própria Anthropic posiciona esse loop como um “dumb loop” (loop burro) — toda a inteligência está na inferência do modelo; o harness só cuida do escalonamento.

Design-chave: context compressor e isolamento por worktree

Alguns detalhes de design que valem atenção:

Context compressor em 3 camadas, limiar de 92%: quando o contexto se aproxima de 92% da capacidade, ele dispara resumo e compressão, preservando decisões de arquitetura e bugs não resolvidos, e descartando saídas repetidas de ferramentas. Isso ecoa as “diretrizes de context engineering” publicadas pela Anthropic: encontrar o menor conjunto de tokens com maior sinal, maximizando a probabilidade de atingir os objetivos.

Isolamento por worktree: cada subagent trabalha em um git worktree independente e em um branch independente; ao mesclar, realiza detecção de conflitos. Essa arquitetura torna possível que vários agentes modifiquem em paralelo a mesma base de código sem se atrapalharem. Entre os três modos de execução de subagentes do Claude Code — “Fork / Teammate / Worktree” — o Worktree é o nível de isolamento mais forte.

Prompt cache com custo de 10%: por meio de cache de prefixos estáveis (system prompt, definições de ferramentas, CLAUDE.md), chamadas repetidas com o mesmo prefixo pagam apenas 10% do custo padrão de tokens. Esse é o ponto-chave para manter os custos sob controle em tarefas de longas sessões.

Por que essa análise repercutiu na comunidade

A postagem de Pachaar recebeu 522 curtidas, 115 retweets, e na seção de comentários apareceram feedbacks como “eu achava que era só um CLI”, “achei que o Claude Code era igual a model + acesso ao terminal, não sabia que a multi-agent layer tinha tantas coisas rodando”, entre outros. Isso reflete que a maioria dos desenvolvedores ainda entende o Claude Code como “o Claude API embrulhado em uma camada de CLI”, subestimando a complexidade do harness.

Pachaar cita como argumento central uma frase de Vivek Trivedy, da LangChain: “se você não é o modelo, então você é harness”. O teste da LangChain no TerminalBench 2.0 — com os mesmos pesos do modelo, alterando apenas o harness externo — comprovou: o ranking saiu da posição 30 e subiu para o 5.

Para leitores da abmedia, esta análise oferece um ponto de referência concreto: quando você vê diferenças entre produtos de agentes como Claude Code, Codex, Gemini Code Assist, a maioria dessas diferenças não está no próprio modelo, e sim no design do harness — estratégias de gerenciamento de contexto, escopo de ferramentas, ciclos de validação e modos de colaboração entre múltiplos agentes. A versão do modelo quando sobe, e as escolhas do harness, determinam o nível da experiência do produto.

Este artigo com a análise de Akshay sobre a arquitetura do Claude Code em 6 camadas: o modelo é apenas um nó no loop. Foi publicado pela primeira vez em Cadeia de Notícias ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.