MÓDULO 4.1

📊 Framework de comparação

Antes de comparar plataformas, é preciso fixar a régua. Este módulo estabelece os 10 eixos que valem para qualquer ferramenta agêntica — da categoria ao público-alvo — e termina preenchendo a matriz inteira para DeerFlow 2.0.

9
Tópicos
60
Minutos
Intermediário
Nível
Teoria
Tipo

💡 Como ler este módulo

Este módulo existe para instalar a régua antes do combate. Não vamos dizer quem é melhor — vamos fixar dez perguntas que você vai repetir para toda plataforma nova que aparecer. Leia inteiro antes dos módulos 4.2 a 4.4. O lab final monta o gabarito da matriz para DeerFlow, que você vai reusar nos labs comparativos.

1

🧭 Por que matriz fixa em vez de "X vs Y"

"Claude Code vs DeerFlow" é uma pergunta preguiçosa. Categoria diferente, público diferente, preço diferente. Sem uma matriz fixa de eixos, a comparação vira torcida: a plataforma que você usou mais recentemente parece melhor, a mais nova parece mais capaz, a que tem a demo mais bonita vence no slide. A matriz é a forma honesta de comparar — e, mais importante, é reutilizável para as plataformas que ainda vão aparecer.

🎯 Conceito Central

Uma matriz fixa é um conjunto pré-definido de 10 perguntas que você aplica a qualquer plataforma agêntica antes de usá-la a fundo. Os eixos são escolhidos porque separam categorias, não porque favorecem uma ferramenta. Quando a matriz está pronta, comparar é preencher linhas — não argumentar.

  • Critério fixo — os eixos não mudam entre plataformas
  • Comparabilidade longitudinal — funciona para ferramentas que ainda nem existem
  • Empate honesto — duas células idênticas são empate, não disputa
  • Anti-marketing — uma feature só entra na matriz se corresponde a um eixo

⚠️ O erro mais comum

Começar a comparação por uma tarefa só. Se o seu primeiro teste é "refatore esse Python", Claude Code parece vencer antes da análise começar. Se é "pesquise 10 fontes sobre X", DeerFlow parece vencer. A matriz vem antes das tarefas — só depois dela é que os labs comparativos rodam.

2

🏷️ Eixo 1: Categoria

Cada plataforma agêntica de 2026 cai em uma de quatro categorias estruturais. Elas não se sobrepõem por acidente: resolvem problemas diferentes, com arquiteturas diferentes. Comparar ferramentas de categorias diferentes como "rivais" é o primeiro erro de leitura.

💻 IDE-agent

Vive dentro do editor de código. Otimizado para tarefas de engenharia de software com acesso ao working tree. Ex.: Claude Code, Antigravity.

🦌 Harness

Hospedeiro de propósito geral que você roda e estende. Multi-canal, multi-skill, multi-modelo. Ex.: DeerFlow 2.0.

📚 Framework

Biblioteca para você construir seu próprio agente. Não é um produto rodando — é código que vira produto. Ex.: LangGraph, LlamaIndex.

☁️ SaaS vertical

Produto fechado focado num domínio, vendido pronto. Pouca ou nenhuma extensibilidade. Ex.: assistentes corporativos de ticket, research SaaS.

💡 Fronteira borrada é normal

Claude Code tem traços de harness (skills, MCP). Antigravity tem traços de IDE e de SaaS. DeerFlow nasceu como produto de research e virou harness. A categoria é sobre o centro de gravidade da ferramenta, não sobre ausência total das outras.

3

🌍 Eixo 2: Onde roda

Pergunta crua: a plataforma roda na sua máquina, no servidor do fornecedor, ou num híbrido? A resposta decide o que você pode fazer com dados sensíveis, quanto você depende do uptime de terceiros e qual é a superfície de ataque para incidentes.

1

Local-first

O processo roda na máquina do usuário

Claude Code roda no terminal do dev; chamadas de modelo saem para Anthropic, mas o contexto de arquivos fica local. Forte em código sensível, fraco em acesso remoto.

2

Cloud-first

Todo o agente vive no servidor do fornecedor

Antigravity puxa bastante computação do lado do Google, com o editor como frontend. Forte em escala, fraco em data residency estrita.

3

Self-hosted / hybrid

Você roda o harness; modelos podem vir de fora

DeerFlow 2.0 você mesmo sobe (Docker ou K8s). Dados, memória, sandbox e traces ficam em infra sua; o provider pode ser OpenAI, Anthropic, vLLM local. É o modelo mais flexível — e o único que dá data residency real.

4

🧩 Eixo 3: Modelo de extensibilidade

Esta pergunta define o teto prático da plataforma. Ferramenta fechada trava no primeiro caso de uso fora do catálogo. Ferramenta extensível sobrevive às mudanças de escopo do time. A forma de estender varia — skills, tools, MCP servers, plugins, extensions — e a DX de cada uma decide quanto esforço custa cobrir um caso novo.

📊 Como as três se posicionam

  • Claude Code: skills oficiais + MCP servers. DX boa, catálogo crescendo, forte em código.
  • Antigravity: extensões dentro do editor, ainda amadurecendo. Catálogo público pequeno em 2026.
  • DeerFlow 2.0: skills próprias + tools + custom agents + MCP. Catálogo público com research, mídia, análise. DX exige Python.
  • Sinal de alerta: quem não tem MCP precisa reinventar toda integração — é sinal de imaturidade em 2026.

💡 Pergunta-teste

"Se amanhã eu quiser uma capacidade X totalmente nova, quantas horas de trabalho, quantos arquivos e quem precisa aprovar?" Se a resposta é "depende do fornecedor lançar", a extensibilidade é decorativa.

5

🧱 Eixo 4: Execução de código e sandbox

Onde o código gerado pelo agente é executado? Esta é a pergunta que mais separa ferramenta pessoal de ferramenta de empresa. Não é sobre performance — é sobre perfil de risco e portabilidade.

📊 Modos típicos por plataforma

  • Sandbox no host: rápido, sem isolamento. Claude Code trabalha assim — confia no dev.
  • Container Docker: isolamento decente, default razoável. DeerFlow suporta.
  • Pod Kubernetes: isolamento forte, quotas, network policies. DeerFlow suporta — único viável em multi-tenant.
  • Sandbox remoto do fornecedor: você não escolhe a imagem, não audita a rede. Mais prático, menos controle.

🚨 Questão de risco

Rodar código gerado por LLM no host é equivalente a rodar um anexo de email de remetente desconhecido. Prompt injection, alucinação e erro de digitação do modelo são todos vetores reais. Para código sensível, o eixo 4 é eliminatório: sem isolamento de verdade, a plataforma fica fora.

6

🧠 Eixo 5: Memória

Quanto a plataforma lembra entre interações? Três níveis: nenhuma (stateless), sessão inteira, ou long-term persistido entre sessões e projetos. Parece detalhe de UX — não é. Memória de longo prazo muda a forma como você usa a ferramenta: deixa de repetir contexto e começa a acumular projeto.

Stateless

Nenhuma memória entre sessões.

Todo contexto é reenviado a cada vez. Simples de raciocinar, ruim para projetos contínuos.

Session memory

Lembra durante a conversa atual.

É o que Claude Code e Antigravity oferecem nativamente: a janela cobre a sessão, mas termina com ela. Forte em code tasks curtas.

Long-term

Memória persiste entre sessões e projetos.

DeerFlow 2.0 tem como primeira classe — user, feedback, project, reference. Forte em projetos longos, exige higiene.

💡 Dica prática

Para code tasks diárias, session memory é suficiente e mais previsível. Para pesquisas longas, consultoria, análise contínua de um mesmo projeto — long-term vira multiplicador de produtividade. Não é "mais memória é sempre melhor"; é memória adequada ao tipo de tarefa.

7

🕸️ Eixo 6: Sub-agentes e orquestração

Tarefas reais em produção quase sempre quebram em sub-tarefas com papéis diferentes. Sem sub-agentes, você acaba fazendo rodízio manual: "lê esses artigos, agora pausa, abre outra sessão, analisa, volta aqui". A pergunta é: a plataforma tem sub-agentes de primeira classe, ou só paralelismo de tools disfarçado?

Sub-agent de verdade

  • Tem contexto próprio isolado
  • Retorna só o resumo pedido
  • Pode ter SOUL/config próprio
  • Paralelizável entre si
  • Roteamento por nome/intent

"Paralelismo de tools" fingindo

  • Tudo volta para o mesmo contexto
  • Sem isolamento de histórico
  • Bug num "sub-agent" contamina o lead
  • Fica inviável em tarefas longas
  • Prejudica memory hygiene

💡 Dica prática

Para identificar qual é qual: peça uma tarefa que envolva ler 20 páginas e resumir em 3 frases. Se o contexto do agente principal cresce proporcionalmente à quantidade de páginas lidas, não há sub-agent de verdade — é só tool call paralela com nome bonito.

8

🧪 Lab: matriz completa de 10 eixos para DeerFlow

Os eixos 1 a 6 foram detalhados acima. Os eixos 7 a 10 (modelos suportados, interface, open source, público-alvo) completam a matriz — vamos exercitá-los agora preenchendo o gabarito para DeerFlow 2.0 usando o que você já aprendeu nas Trilhas 1, 2 e 3.

🎯 Passos do lab

  1. Abra uma planilha (ou tabela Markdown) com duas colunas: "Eixo" e "DeerFlow 2.0".
  2. Preencha os eixos 1-6 com base nos tópicos acima — uma frase por célula, citando a fonte (README, docs, módulo da Trilha 1).
  3. Eixo 7 — Modelos suportados: multi-vendor (OpenAI, Anthropic via Claude Code OAuth, OpenRouter, vLLM local, Doubao/DeepSeek/Kimi). Cite o módulo 1.2.
  4. Eixo 8 — Interface: web (Next.js), API, e canais IM (Telegram, Slack, Feishu, WeChat, WeCom). Cite o módulo 1.6.
  5. Eixo 9 — Open source? Sim, repositório público, licença permissiva. Cite o README.
  6. Eixo 10 — Público-alvo primário: times que querem hospedar e estender o harness em casos de uso além de código — research, mídia, análise, integração com IM.
  7. Revisão crítica: releia a tabela e marque com "depende" toda célula em que a resposta muda por contexto (ex.: sandbox depende do deploy).

📊 Critérios de pronto

  • 10 células preenchidas, nenhuma em branco
  • Cada célula tem 1 frase ou 1 lista curta, não um parágrafo
  • Pelo menos 3 células têm link direto para README ou docs
  • Células "depende" listam explicitamente de que dependem
  • O gabarito cabe numa tela sem rolar

💡 Por que começar pelo DeerFlow

Porque é a plataforma que você já conhece depois das Trilhas 1-3. Preencher primeiro uma ferramenta conhecida calibra o tamanho de cada célula e mostra quais eixos são difíceis sem hands-on. Nos módulos 4.2-4.4, você reusa esta matriz para Claude Code e Antigravity. Quando terminar, confira sua tabela contra o gabarito visual da seção 9 abaixo.

9

📋 Gabarito visual: matriz e gráficos comparativos

Depois de preencher sua matriz no lab, compare com o gabarito abaixo. Os 10 eixos aparecem primeiro como tabela completa com as três plataformas lado a lado, depois como gráficos de barras para as dimensões mais decisivas. Use como referência — plataformas mudam rápido, então releia em 6 meses.

⚠️ Leitura honesta

Os gráficos usam escala 1–5 por dimensão. Não é ranking geral — cada dimensão vale por si. "Forte em isolamento" não significa "melhor plataforma"; significa exatamente isso: forte em isolamento. Some pelas dimensões que importam para o seu caso, não pelas que estão no gráfico.

📊 Matriz de 10 eixos — as três plataformas

Eixo 🦌 DeerFlow 2.0 💻 Claude Code 🚀 Antigravity
1. Categoria Harness genérico open-source IDE-agent (CLI + IDE extensions) IDE-agent (editor dedicado)
2. Onde roda Self-hosted (Docker ou K8s) + providers à escolha Local-first (terminal/IDE do dev) + chamadas para Anthropic Cloud-first com editor local como frontend
3. Extensibilidade Skills + tools + custom agents + MCP + providers Skills oficiais + MCP servers + hooks Extensões dentro do editor, catálogo pequeno em 2026
4. Sandbox Local / Docker / Kubernetes configurável No host, confia no dev; approval prompts Sandbox do fornecedor, não auditável pelo usuário
5. Memória Long-term de 1ª classe · user, feedback, project, reference File-based (CLAUDE.md + memory tool) por projeto Session + persistência leve no workspace
6. Sub-agentes / orquestração Sub-agents + custom agents com SOUL + lead_agent Task tool com sub-agents reais e isolamento de contexto Multi-agente de 1ª classe dentro do editor
7. Modelos suportados Multi-vendor: OpenAI, Anthropic, OpenRouter, vLLM local, Doubao, DeepSeek, Kimi Anthropic (Claude) apenas Google (Gemini) apenas
8. Interface Web (Next.js), API, IM (Telegram, Slack, Feishu, WeChat, WeCom) CLI + extensões IDE (VS Code, JetBrains) + web Editor dedicado (desktop)
9. Open source? Sim, repositório público, licença permissiva Parcial · CLI fechada, SDK e partes abertas Fechado
10. Público-alvo primário Times que hospedam e estendem o harness para research, mídia, análise, IM Devs e times de engenharia de software Devs que querem IDE-first com agentes autônomos

Leitura: a coluna amber destaca DeerFlow só para ajudar o olho — não implica vantagem. Células da mesma linha que dizem coisas diferentes normalmente significam escopo diferente, não "melhor/pior".

📈 Gráficos comparativos

Cinco dimensões visualmente. Escala 1 = mínimo, 5 = máximo naquela dimensão específica. Leia uma por uma.

🛡️ Isolamento de sandbox

1 = sem isolamento · 5 = pronto para multi-tenant
🦌 DeerFlow 2.05 / 5

Local/Docker/K8s configurável · quotas, policies, multi-tenant real.

💻 Claude Code2 / 5

Executa no host; confia no dev. Approval prompts, mas sem isolamento real.

🚀 Antigravity3 / 5

Sandbox do fornecedor (cloud-side), não auditável pelo usuário.

🧠 Profundidade de memória

1 = stateless · 5 = long-term categorizada
🦌 DeerFlow 2.05 / 5

Long-term de 1ª classe, 4 categorias, revisável pelo usuário.

💻 Claude Code4 / 5

File-based (CLAUDE.md + memory tool), persistente por projeto, sem categorização nativa.

🚀 Antigravity3 / 5

Session + persistência leve no workspace; long-term ainda amadurecendo.

🧩 Extensibilidade

1 = fechada · 5 = múltiplas formas plugáveis
🦌 DeerFlow 2.05 / 5

Skills + tools + custom agents com SOUL + MCP + providers — cinco pontos de extensão.

💻 Claude Code4 / 5

Skills oficiais + MCP servers + hooks + settings. DX madura, catálogo crescendo.

🚀 Antigravity2 / 5

Extensões dentro do editor, catálogo público pequeno em 2026.

🌐 Cobertura fora de código

1 = só engenharia · 5 = research / mídia / análise / IM
🦌 DeerFlow 2.05 / 5

Skills maduras para research, PPT, podcast, newsletter, vídeo, análise, IM nativo.

💻 Claude Code2 / 5

Centro de gravidade em engenharia de software; fora disso é possível, mas não é forte.

🚀 Antigravity2 / 5

IDE-first; foco em desenvolvimento de software dentro do editor.

🔒 Data residency e controle

1 = cloud only · 5 = self-hosted completo
🦌 DeerFlow 2.05 / 5

Self-hosted; dados, memória, sandbox e traces em infra sua. vLLM local fecha o circuito.

💻 Claude Code3 / 5

Contexto local, mas chamadas de modelo saem para Anthropic. Bom para código, fraco para dados regulados.

🚀 Antigravity2 / 5

Cloud-first; data residency estrita fica difícil de garantir.

💡 Como usar os gráficos na decisão

Escolha 2 ou 3 dimensões que importam para o seu caso e some os scores só delas. Ignore as outras. Exemplos:

  • Engenharia de software pura: priorize extensibilidade + sub-agentes + sandbox razoável — Claude Code e Antigravity brigam aqui.
  • Research + mídia + IM: priorize cobertura fora de código + memória long-term — DeerFlow vence naturalmente.
  • Dados regulados / compliance: priorize data residency + isolamento de sandbox — DeerFlow self-hosted é o único viável.

📝 Resumo do Módulo

Régua antes do combate — matriz fixa de 10 eixos é a forma honesta de comparar plataformas agênticas, sem cair em "X é melhor que Y".
Categoria determina tudo — IDE-agent, harness, framework, SaaS resolvem problemas diferentes. Não compare categorias como rivais.
Onde roda e sandbox — são os eixos que definem se a ferramenta entra na sua empresa ou só na sua máquina pessoal.
Memória e sub-agentes — separam "assistente de uma tarefa" de "plataforma que acumula projeto ao longo do tempo".
Matriz preenchida para DeerFlow — o gabarito que vai ser reusado nos módulos 4.2-4.4 para Claude Code e Antigravity.
Gabarito visual na seção 9 — tabela 3 plataformas × 10 eixos + cinco gráficos de barras (sandbox, memória, extensibilidade, cobertura fora de código, data residency). Releia a cada 6 meses porque plataformas mudam rápido.

Próximo Módulo:

4.2 — 🎯 Posicionamento das 3 plataformas

O "esqueleto honesto" do curso: Claude Code, Antigravity e DeerFlow 2.0 em uma frase cada. Termina com um lab-relâmpago dizendo "oi" nas três.