Módulo 4.1 — Framework de comparação | DeerFlow 2.0

💡 Como ler este módulo

Este módulo existe para instalar a régua antes do combate. Não vamos dizer quem é melhor — vamos fixar dez perguntas que você vai repetir para toda plataforma nova que aparecer. Leia inteiro antes dos módulos 4.2 a 4.4. O lab final monta o gabarito da matriz para DeerFlow, que você vai reusar nos labs comparativos.

🧭 Por que matriz fixa em vez de "X vs Y"

"Claude Code vs DeerFlow" é uma pergunta preguiçosa. Categoria diferente, público diferente, preço diferente. Sem uma matriz fixa de eixos, a comparação vira torcida: a plataforma que você usou mais recentemente parece melhor, a mais nova parece mais capaz, a que tem a demo mais bonita vence no slide. A matriz é a forma honesta de comparar — e, mais importante, é reutilizável para as plataformas que ainda vão aparecer.

🎯 Conceito Central

Uma matriz fixa é um conjunto pré-definido de 10 perguntas que você aplica a qualquer plataforma agêntica antes de usá-la a fundo. Os eixos são escolhidos porque separam categorias, não porque favorecem uma ferramenta. Quando a matriz está pronta, comparar é preencher linhas — não argumentar.

•Critério fixo — os eixos não mudam entre plataformas
•Comparabilidade longitudinal — funciona para ferramentas que ainda nem existem
•Empate honesto — duas células idênticas são empate, não disputa
•Anti-marketing — uma feature só entra na matriz se corresponde a um eixo

⚠️ O erro mais comum

Começar a comparação por uma tarefa só. Se o seu primeiro teste é "refatore esse Python", Claude Code parece vencer antes da análise começar. Se é "pesquise 10 fontes sobre X", DeerFlow parece vencer. A matriz vem antes das tarefas — só depois dela é que os labs comparativos rodam.

🏷️ Eixo 1: Categoria

Cada plataforma agêntica de 2026 cai em uma de quatro categorias estruturais. Elas não se sobrepõem por acidente: resolvem problemas diferentes, com arquiteturas diferentes. Comparar ferramentas de categorias diferentes como "rivais" é o primeiro erro de leitura.

💻 IDE-agent

Vive dentro do editor de código. Otimizado para tarefas de engenharia de software com acesso ao working tree. Ex.: Claude Code, Antigravity.

🦌 Harness

Hospedeiro de propósito geral que você roda e estende. Multi-canal, multi-skill, multi-modelo. Ex.: DeerFlow 2.0.

📚 Framework

Biblioteca para você construir seu próprio agente. Não é um produto rodando — é código que vira produto. Ex.: LangGraph, LlamaIndex.

☁️ SaaS vertical

Produto fechado focado num domínio, vendido pronto. Pouca ou nenhuma extensibilidade. Ex.: assistentes corporativos de ticket, research SaaS.

💡 Fronteira borrada é normal

Claude Code tem traços de harness (skills, MCP). Antigravity tem traços de IDE e de SaaS. DeerFlow nasceu como produto de research e virou harness. A categoria é sobre o centro de gravidade da ferramenta, não sobre ausência total das outras.

🌍 Eixo 2: Onde roda

Pergunta crua: a plataforma roda na sua máquina, no servidor do fornecedor, ou num híbrido? A resposta decide o que você pode fazer com dados sensíveis, quanto você depende do uptime de terceiros e qual é a superfície de ataque para incidentes.

Local-first

O processo roda na máquina do usuário

Claude Code roda no terminal do dev; chamadas de modelo saem para Anthropic, mas o contexto de arquivos fica local. Forte em código sensível, fraco em acesso remoto.

Cloud-first

Todo o agente vive no servidor do fornecedor

Antigravity puxa bastante computação do lado do Google, com o editor como frontend. Forte em escala, fraco em data residency estrita.

Self-hosted / hybrid

Você roda o harness; modelos podem vir de fora

DeerFlow 2.0 você mesmo sobe (Docker ou K8s). Dados, memória, sandbox e traces ficam em infra sua; o provider pode ser OpenAI, Anthropic, vLLM local. É o modelo mais flexível — e o único que dá data residency real.

🧩 Eixo 3: Modelo de extensibilidade

Esta pergunta define o teto prático da plataforma. Ferramenta fechada trava no primeiro caso de uso fora do catálogo. Ferramenta extensível sobrevive às mudanças de escopo do time. A forma de estender varia — skills, tools, MCP servers, plugins, extensions — e a DX de cada uma decide quanto esforço custa cobrir um caso novo.

📊 Como as três se posicionam

Claude Code: skills oficiais + MCP servers. DX boa, catálogo crescendo, forte em código.
Antigravity: extensões dentro do editor, ainda amadurecendo. Catálogo público pequeno em 2026.
DeerFlow 2.0: skills próprias + tools + custom agents + MCP. Catálogo público com research, mídia, análise. DX exige Python.
Sinal de alerta: quem não tem MCP precisa reinventar toda integração — é sinal de imaturidade em 2026.

💡 Pergunta-teste

"Se amanhã eu quiser uma capacidade X totalmente nova, quantas horas de trabalho, quantos arquivos e quem precisa aprovar?" Se a resposta é "depende do fornecedor lançar", a extensibilidade é decorativa.

🧱 Eixo 4: Execução de código e sandbox

Onde o código gerado pelo agente é executado? Esta é a pergunta que mais separa ferramenta pessoal de ferramenta de empresa. Não é sobre performance — é sobre perfil de risco e portabilidade.

📊 Modos típicos por plataforma

Sandbox no host: rápido, sem isolamento. Claude Code trabalha assim — confia no dev.
Container Docker: isolamento decente, default razoável. DeerFlow suporta.
Pod Kubernetes: isolamento forte, quotas, network policies. DeerFlow suporta — único viável em multi-tenant.
Sandbox remoto do fornecedor: você não escolhe a imagem, não audita a rede. Mais prático, menos controle.

🚨 Questão de risco

Rodar código gerado por LLM no host é equivalente a rodar um anexo de email de remetente desconhecido. Prompt injection, alucinação e erro de digitação do modelo são todos vetores reais. Para código sensível, o eixo 4 é eliminatório: sem isolamento de verdade, a plataforma fica fora.

🧠 Eixo 5: Memória

Quanto a plataforma lembra entre interações? Três níveis: nenhuma (stateless), sessão inteira, ou long-term persistido entre sessões e projetos. Parece detalhe de UX — não é. Memória de longo prazo muda a forma como você usa a ferramenta: deixa de repetir contexto e começa a acumular projeto.

Stateless

Nenhuma memória entre sessões.

Todo contexto é reenviado a cada vez. Simples de raciocinar, ruim para projetos contínuos.

Session memory

Lembra durante a conversa atual.

É o que Claude Code e Antigravity oferecem nativamente: a janela cobre a sessão, mas termina com ela. Forte em code tasks curtas.

Long-term

Memória persiste entre sessões e projetos.

DeerFlow 2.0 tem como primeira classe — user, feedback, project, reference. Forte em projetos longos, exige higiene.

💡 Dica prática

Para code tasks diárias, session memory é suficiente e mais previsível. Para pesquisas longas, consultoria, análise contínua de um mesmo projeto — long-term vira multiplicador de produtividade. Não é "mais memória é sempre melhor"; é memória adequada ao tipo de tarefa.

🕸️ Eixo 6: Sub-agentes e orquestração

Tarefas reais em produção quase sempre quebram em sub-tarefas com papéis diferentes. Sem sub-agentes, você acaba fazendo rodízio manual: "lê esses artigos, agora pausa, abre outra sessão, analisa, volta aqui". A pergunta é: a plataforma tem sub-agentes de primeira classe, ou só paralelismo de tools disfarçado?

Sub-agent de verdade

Tem contexto próprio isolado
Retorna só o resumo pedido
Pode ter SOUL/config próprio
Paralelizável entre si
Roteamento por nome/intent

"Paralelismo de tools" fingindo

Tudo volta para o mesmo contexto
Sem isolamento de histórico
Bug num "sub-agent" contamina o lead
Fica inviável em tarefas longas
Prejudica memory hygiene

💡 Dica prática

Para identificar qual é qual: peça uma tarefa que envolva ler 20 páginas e resumir em 3 frases. Se o contexto do agente principal cresce proporcionalmente à quantidade de páginas lidas, não há sub-agent de verdade — é só tool call paralela com nome bonito.

🧪 Lab: matriz completa de 10 eixos para DeerFlow

Os eixos 1 a 6 foram detalhados acima. Os eixos 7 a 10 (modelos suportados, interface, open source, público-alvo) completam a matriz — vamos exercitá-los agora preenchendo o gabarito para DeerFlow 2.0 usando o que você já aprendeu nas Trilhas 1, 2 e 3.

🎯 Passos do lab

Abra uma planilha (ou tabela Markdown) com duas colunas: "Eixo" e "DeerFlow 2.0".
Preencha os eixos 1-6 com base nos tópicos acima — uma frase por célula, citando a fonte (README, docs, módulo da Trilha 1).
Eixo 7 — Modelos suportados: multi-vendor (OpenAI, Anthropic via Claude Code OAuth, OpenRouter, vLLM local, Doubao/DeepSeek/Kimi). Cite o módulo 1.2.
Eixo 8 — Interface: web (Next.js), API, e canais IM (Telegram, Slack, Feishu, WeChat, WeCom). Cite o módulo 1.6.
Eixo 9 — Open source? Sim, repositório público, licença permissiva. Cite o README.
Eixo 10 — Público-alvo primário: times que querem hospedar e estender o harness em casos de uso além de código — research, mídia, análise, integração com IM.
Revisão crítica: releia a tabela e marque com "depende" toda célula em que a resposta muda por contexto (ex.: sandbox depende do deploy).

📊 Critérios de pronto

10 células preenchidas, nenhuma em branco
Cada célula tem 1 frase ou 1 lista curta, não um parágrafo
Pelo menos 3 células têm link direto para README ou docs
Células "depende" listam explicitamente de que dependem
O gabarito cabe numa tela sem rolar

💡 Por que começar pelo DeerFlow

Porque é a plataforma que você já conhece depois das Trilhas 1-3. Preencher primeiro uma ferramenta conhecida calibra o tamanho de cada célula e mostra quais eixos são difíceis sem hands-on. Nos módulos 4.2-4.4, você reusa esta matriz para Claude Code e Antigravity. Quando terminar, confira sua tabela contra o gabarito visual da seção 9 abaixo.

📋 Gabarito visual: matriz e gráficos comparativos

Depois de preencher sua matriz no lab, compare com o gabarito abaixo. Os 10 eixos aparecem primeiro como tabela completa com as três plataformas lado a lado, depois como gráficos de barras para as dimensões mais decisivas. Use como referência — plataformas mudam rápido, então releia em 6 meses.

⚠️ Leitura honesta

Os gráficos usam escala 1–5 por dimensão. Não é ranking geral — cada dimensão vale por si. "Forte em isolamento" não significa "melhor plataforma"; significa exatamente isso: forte em isolamento. Some pelas dimensões que importam para o seu caso, não pelas que estão no gráfico.

📊 Matriz de 10 eixos — as três plataformas

Eixo	🦌 DeerFlow 2.0	💻 Claude Code	🚀 Antigravity
1. Categoria	Harness genérico open-source	IDE-agent (CLI + IDE extensions)	IDE-agent (editor dedicado)
2. Onde roda	Self-hosted (Docker ou K8s) + providers à escolha	Local-first (terminal/IDE do dev) + chamadas para Anthropic	Cloud-first com editor local como frontend
3. Extensibilidade	Skills + tools + custom agents + MCP + providers	Skills oficiais + MCP servers + hooks	Extensões dentro do editor, catálogo pequeno em 2026
4. Sandbox	Local / Docker / Kubernetes configurável	No host, confia no dev; approval prompts	Sandbox do fornecedor, não auditável pelo usuário
5. Memória	Long-term de 1ª classe · user, feedback, project, reference	File-based (CLAUDE.md + memory tool) por projeto	Session + persistência leve no workspace
6. Sub-agentes / orquestração	Sub-agents + custom agents com SOUL + lead_agent	Task tool com sub-agents reais e isolamento de contexto	Multi-agente de 1ª classe dentro do editor
7. Modelos suportados	Multi-vendor: OpenAI, Anthropic, OpenRouter, vLLM local, Doubao, DeepSeek, Kimi	Anthropic (Claude) apenas	Google (Gemini) apenas
8. Interface	Web (Next.js), API, IM (Telegram, Slack, Feishu, WeChat, WeCom)	CLI + extensões IDE (VS Code, JetBrains) + web	Editor dedicado (desktop)
9. Open source?	Sim, repositório público, licença permissiva	Parcial · CLI fechada, SDK e partes abertas	Fechado
10. Público-alvo primário	Times que hospedam e estendem o harness para research, mídia, análise, IM	Devs e times de engenharia de software	Devs que querem IDE-first com agentes autônomos

Leitura: a coluna amber destaca DeerFlow só para ajudar o olho — não implica vantagem. Células da mesma linha que dizem coisas diferentes normalmente significam escopo diferente, não "melhor/pior".

📈 Gráficos comparativos

Cinco dimensões visualmente. Escala 1 = mínimo, 5 = máximo naquela dimensão específica. Leia uma por uma.

🛡️ Isolamento de sandbox

1 = sem isolamento · 5 = pronto para multi-tenant

🦌 DeerFlow 2.05 / 5

Local/Docker/K8s configurável · quotas, policies, multi-tenant real.

💻 Claude Code2 / 5

Executa no host; confia no dev. Approval prompts, mas sem isolamento real.

🚀 Antigravity3 / 5

Sandbox do fornecedor (cloud-side), não auditável pelo usuário.

🧠 Profundidade de memória

1 = stateless · 5 = long-term categorizada

🦌 DeerFlow 2.05 / 5

Long-term de 1ª classe, 4 categorias, revisável pelo usuário.

💻 Claude Code4 / 5

File-based (CLAUDE.md + memory tool), persistente por projeto, sem categorização nativa.

🚀 Antigravity3 / 5

Session + persistência leve no workspace; long-term ainda amadurecendo.

🧩 Extensibilidade

1 = fechada · 5 = múltiplas formas plugáveis

🦌 DeerFlow 2.05 / 5

Skills + tools + custom agents com SOUL + MCP + providers — cinco pontos de extensão.

💻 Claude Code4 / 5

Skills oficiais + MCP servers + hooks + settings. DX madura, catálogo crescendo.

🚀 Antigravity2 / 5

Extensões dentro do editor, catálogo público pequeno em 2026.

🌐 Cobertura fora de código

1 = só engenharia · 5 = research / mídia / análise / IM

🦌 DeerFlow 2.05 / 5

Skills maduras para research, PPT, podcast, newsletter, vídeo, análise, IM nativo.

💻 Claude Code2 / 5

Centro de gravidade em engenharia de software; fora disso é possível, mas não é forte.

🚀 Antigravity2 / 5

IDE-first; foco em desenvolvimento de software dentro do editor.

🔒 Data residency e controle

1 = cloud only · 5 = self-hosted completo

🦌 DeerFlow 2.05 / 5

Self-hosted; dados, memória, sandbox e traces em infra sua. vLLM local fecha o circuito.

💻 Claude Code3 / 5

Contexto local, mas chamadas de modelo saem para Anthropic. Bom para código, fraco para dados regulados.

🚀 Antigravity2 / 5

Cloud-first; data residency estrita fica difícil de garantir.

💡 Como usar os gráficos na decisão

Escolha 2 ou 3 dimensões que importam para o seu caso e some os scores só delas. Ignore as outras. Exemplos:

→Engenharia de software pura: priorize extensibilidade + sub-agentes + sandbox razoável — Claude Code e Antigravity brigam aqui.
→Research + mídia + IM: priorize cobertura fora de código + memória long-term — DeerFlow vence naturalmente.
→Dados regulados / compliance: priorize data residency + isolamento de sandbox — DeerFlow self-hosted é o único viável.

📝 Resumo do Módulo

✓

Régua antes do combate — matriz fixa de 10 eixos é a forma honesta de comparar plataformas agênticas, sem cair em "X é melhor que Y".

✓

Categoria determina tudo — IDE-agent, harness, framework, SaaS resolvem problemas diferentes. Não compare categorias como rivais.

✓

Onde roda e sandbox — são os eixos que definem se a ferramenta entra na sua empresa ou só na sua máquina pessoal.

✓

Memória e sub-agentes — separam "assistente de uma tarefa" de "plataforma que acumula projeto ao longo do tempo".

✓

Matriz preenchida para DeerFlow — o gabarito que vai ser reusado nos módulos 4.2-4.4 para Claude Code e Antigravity.

✓

Gabarito visual na seção 9 — tabela 3 plataformas × 10 eixos + cinco gráficos de barras (sandbox, memória, extensibilidade, cobertura fora de código, data residency). Releia a cada 6 meses porque plataformas mudam rápido.

Próximo Módulo:

4.2 — 🎯 Posicionamento das 3 plataformas

O "esqueleto honesto" do curso: Claude Code, Antigravity e DeerFlow 2.0 em uma frase cada. Termina com um lab-relâmpago dizendo "oi" nas três.

← Trilha 3 Índice da Trilha Próximo Módulo →