💡 Como ler este módulo
Este módulo existe para instalar a régua antes do combate. Não vamos dizer quem é melhor — vamos fixar dez perguntas que você vai repetir para toda plataforma nova que aparecer. Leia inteiro antes dos módulos 4.2 a 4.4. O lab final monta o gabarito da matriz para DeerFlow, que você vai reusar nos labs comparativos.
🧭 Por que matriz fixa em vez de "X vs Y"
"Claude Code vs DeerFlow" é uma pergunta preguiçosa. Categoria diferente, público diferente, preço diferente. Sem uma matriz fixa de eixos, a comparação vira torcida: a plataforma que você usou mais recentemente parece melhor, a mais nova parece mais capaz, a que tem a demo mais bonita vence no slide. A matriz é a forma honesta de comparar — e, mais importante, é reutilizável para as plataformas que ainda vão aparecer.
🎯 Conceito Central
Uma matriz fixa é um conjunto pré-definido de 10 perguntas que você aplica a qualquer plataforma agêntica antes de usá-la a fundo. Os eixos são escolhidos porque separam categorias, não porque favorecem uma ferramenta. Quando a matriz está pronta, comparar é preencher linhas — não argumentar.
- •Critério fixo — os eixos não mudam entre plataformas
- •Comparabilidade longitudinal — funciona para ferramentas que ainda nem existem
- •Empate honesto — duas células idênticas são empate, não disputa
- •Anti-marketing — uma feature só entra na matriz se corresponde a um eixo
⚠️ O erro mais comum
Começar a comparação por uma tarefa só. Se o seu primeiro teste é "refatore esse Python", Claude Code parece vencer antes da análise começar. Se é "pesquise 10 fontes sobre X", DeerFlow parece vencer. A matriz vem antes das tarefas — só depois dela é que os labs comparativos rodam.
🏷️ Eixo 1: Categoria
Cada plataforma agêntica de 2026 cai em uma de quatro categorias estruturais. Elas não se sobrepõem por acidente: resolvem problemas diferentes, com arquiteturas diferentes. Comparar ferramentas de categorias diferentes como "rivais" é o primeiro erro de leitura.
💻 IDE-agent
Vive dentro do editor de código. Otimizado para tarefas de engenharia de software com acesso ao working tree. Ex.: Claude Code, Antigravity.
🦌 Harness
Hospedeiro de propósito geral que você roda e estende. Multi-canal, multi-skill, multi-modelo. Ex.: DeerFlow 2.0.
📚 Framework
Biblioteca para você construir seu próprio agente. Não é um produto rodando — é código que vira produto. Ex.: LangGraph, LlamaIndex.
☁️ SaaS vertical
Produto fechado focado num domínio, vendido pronto. Pouca ou nenhuma extensibilidade. Ex.: assistentes corporativos de ticket, research SaaS.
💡 Fronteira borrada é normal
Claude Code tem traços de harness (skills, MCP). Antigravity tem traços de IDE e de SaaS. DeerFlow nasceu como produto de research e virou harness. A categoria é sobre o centro de gravidade da ferramenta, não sobre ausência total das outras.
🌍 Eixo 2: Onde roda
Pergunta crua: a plataforma roda na sua máquina, no servidor do fornecedor, ou num híbrido? A resposta decide o que você pode fazer com dados sensíveis, quanto você depende do uptime de terceiros e qual é a superfície de ataque para incidentes.
Local-first
O processo roda na máquina do usuário
Claude Code roda no terminal do dev; chamadas de modelo saem para Anthropic, mas o contexto de arquivos fica local. Forte em código sensível, fraco em acesso remoto.
Cloud-first
Todo o agente vive no servidor do fornecedor
Antigravity puxa bastante computação do lado do Google, com o editor como frontend. Forte em escala, fraco em data residency estrita.
Self-hosted / hybrid
Você roda o harness; modelos podem vir de fora
DeerFlow 2.0 você mesmo sobe (Docker ou K8s). Dados, memória, sandbox e traces ficam em infra sua; o provider pode ser OpenAI, Anthropic, vLLM local. É o modelo mais flexível — e o único que dá data residency real.
🧩 Eixo 3: Modelo de extensibilidade
Esta pergunta define o teto prático da plataforma. Ferramenta fechada trava no primeiro caso de uso fora do catálogo. Ferramenta extensível sobrevive às mudanças de escopo do time. A forma de estender varia — skills, tools, MCP servers, plugins, extensions — e a DX de cada uma decide quanto esforço custa cobrir um caso novo.
📊 Como as três se posicionam
- Claude Code: skills oficiais + MCP servers. DX boa, catálogo crescendo, forte em código.
- Antigravity: extensões dentro do editor, ainda amadurecendo. Catálogo público pequeno em 2026.
- DeerFlow 2.0: skills próprias + tools + custom agents + MCP. Catálogo público com research, mídia, análise. DX exige Python.
- Sinal de alerta: quem não tem MCP precisa reinventar toda integração — é sinal de imaturidade em 2026.
💡 Pergunta-teste
"Se amanhã eu quiser uma capacidade X totalmente nova, quantas horas de trabalho, quantos arquivos e quem precisa aprovar?" Se a resposta é "depende do fornecedor lançar", a extensibilidade é decorativa.
🧱 Eixo 4: Execução de código e sandbox
Onde o código gerado pelo agente é executado? Esta é a pergunta que mais separa ferramenta pessoal de ferramenta de empresa. Não é sobre performance — é sobre perfil de risco e portabilidade.
📊 Modos típicos por plataforma
- Sandbox no host: rápido, sem isolamento. Claude Code trabalha assim — confia no dev.
- Container Docker: isolamento decente, default razoável. DeerFlow suporta.
- Pod Kubernetes: isolamento forte, quotas, network policies. DeerFlow suporta — único viável em multi-tenant.
- Sandbox remoto do fornecedor: você não escolhe a imagem, não audita a rede. Mais prático, menos controle.
🚨 Questão de risco
Rodar código gerado por LLM no host é equivalente a rodar um anexo de email de remetente desconhecido. Prompt injection, alucinação e erro de digitação do modelo são todos vetores reais. Para código sensível, o eixo 4 é eliminatório: sem isolamento de verdade, a plataforma fica fora.
🧠 Eixo 5: Memória
Quanto a plataforma lembra entre interações? Três níveis: nenhuma (stateless), sessão inteira, ou long-term persistido entre sessões e projetos. Parece detalhe de UX — não é. Memória de longo prazo muda a forma como você usa a ferramenta: deixa de repetir contexto e começa a acumular projeto.
Stateless
Nenhuma memória entre sessões.
Todo contexto é reenviado a cada vez. Simples de raciocinar, ruim para projetos contínuos.
Session memory
Lembra durante a conversa atual.
É o que Claude Code e Antigravity oferecem nativamente: a janela cobre a sessão, mas termina com ela. Forte em code tasks curtas.
Long-term
Memória persiste entre sessões e projetos.
DeerFlow 2.0 tem como primeira classe — user, feedback, project, reference. Forte em projetos longos, exige higiene.
💡 Dica prática
Para code tasks diárias, session memory é suficiente e mais previsível. Para pesquisas longas, consultoria, análise contínua de um mesmo projeto — long-term vira multiplicador de produtividade. Não é "mais memória é sempre melhor"; é memória adequada ao tipo de tarefa.
🕸️ Eixo 6: Sub-agentes e orquestração
Tarefas reais em produção quase sempre quebram em sub-tarefas com papéis diferentes. Sem sub-agentes, você acaba fazendo rodízio manual: "lê esses artigos, agora pausa, abre outra sessão, analisa, volta aqui". A pergunta é: a plataforma tem sub-agentes de primeira classe, ou só paralelismo de tools disfarçado?
Sub-agent de verdade
- Tem contexto próprio isolado
- Retorna só o resumo pedido
- Pode ter SOUL/config próprio
- Paralelizável entre si
- Roteamento por nome/intent
"Paralelismo de tools" fingindo
- Tudo volta para o mesmo contexto
- Sem isolamento de histórico
- Bug num "sub-agent" contamina o lead
- Fica inviável em tarefas longas
- Prejudica memory hygiene
💡 Dica prática
Para identificar qual é qual: peça uma tarefa que envolva ler 20 páginas e resumir em 3 frases. Se o contexto do agente principal cresce proporcionalmente à quantidade de páginas lidas, não há sub-agent de verdade — é só tool call paralela com nome bonito.
🧪 Lab: matriz completa de 10 eixos para DeerFlow
Os eixos 1 a 6 foram detalhados acima. Os eixos 7 a 10 (modelos suportados, interface, open source, público-alvo) completam a matriz — vamos exercitá-los agora preenchendo o gabarito para DeerFlow 2.0 usando o que você já aprendeu nas Trilhas 1, 2 e 3.
🎯 Passos do lab
- Abra uma planilha (ou tabela Markdown) com duas colunas: "Eixo" e "DeerFlow 2.0".
- Preencha os eixos 1-6 com base nos tópicos acima — uma frase por célula, citando a fonte (README, docs, módulo da Trilha 1).
- Eixo 7 — Modelos suportados: multi-vendor (OpenAI, Anthropic via Claude Code OAuth, OpenRouter, vLLM local, Doubao/DeepSeek/Kimi). Cite o módulo 1.2.
- Eixo 8 — Interface: web (Next.js), API, e canais IM (Telegram, Slack, Feishu, WeChat, WeCom). Cite o módulo 1.6.
- Eixo 9 — Open source? Sim, repositório público, licença permissiva. Cite o README.
- Eixo 10 — Público-alvo primário: times que querem hospedar e estender o harness em casos de uso além de código — research, mídia, análise, integração com IM.
- Revisão crítica: releia a tabela e marque com "depende" toda célula em que a resposta muda por contexto (ex.: sandbox depende do deploy).
📊 Critérios de pronto
- 10 células preenchidas, nenhuma em branco
- Cada célula tem 1 frase ou 1 lista curta, não um parágrafo
- Pelo menos 3 células têm link direto para README ou docs
- Células "depende" listam explicitamente de que dependem
- O gabarito cabe numa tela sem rolar
💡 Por que começar pelo DeerFlow
Porque é a plataforma que você já conhece depois das Trilhas 1-3. Preencher primeiro uma ferramenta conhecida calibra o tamanho de cada célula e mostra quais eixos são difíceis sem hands-on. Nos módulos 4.2-4.4, você reusa esta matriz para Claude Code e Antigravity. Quando terminar, confira sua tabela contra o gabarito visual da seção 9 abaixo.
📋 Gabarito visual: matriz e gráficos comparativos
Depois de preencher sua matriz no lab, compare com o gabarito abaixo. Os 10 eixos aparecem primeiro como tabela completa com as três plataformas lado a lado, depois como gráficos de barras para as dimensões mais decisivas. Use como referência — plataformas mudam rápido, então releia em 6 meses.
⚠️ Leitura honesta
Os gráficos usam escala 1–5 por dimensão. Não é ranking geral — cada dimensão vale por si. "Forte em isolamento" não significa "melhor plataforma"; significa exatamente isso: forte em isolamento. Some pelas dimensões que importam para o seu caso, não pelas que estão no gráfico.
📊 Matriz de 10 eixos — as três plataformas
| Eixo | 🦌 DeerFlow 2.0 | 💻 Claude Code | 🚀 Antigravity |
|---|---|---|---|
| 1. Categoria | Harness genérico open-source | IDE-agent (CLI + IDE extensions) | IDE-agent (editor dedicado) |
| 2. Onde roda | Self-hosted (Docker ou K8s) + providers à escolha | Local-first (terminal/IDE do dev) + chamadas para Anthropic | Cloud-first com editor local como frontend |
| 3. Extensibilidade | Skills + tools + custom agents + MCP + providers | Skills oficiais + MCP servers + hooks | Extensões dentro do editor, catálogo pequeno em 2026 |
| 4. Sandbox | Local / Docker / Kubernetes configurável | No host, confia no dev; approval prompts | Sandbox do fornecedor, não auditável pelo usuário |
| 5. Memória | Long-term de 1ª classe · user, feedback, project, reference | File-based (CLAUDE.md + memory tool) por projeto | Session + persistência leve no workspace |
| 6. Sub-agentes / orquestração | Sub-agents + custom agents com SOUL + lead_agent | Task tool com sub-agents reais e isolamento de contexto | Multi-agente de 1ª classe dentro do editor |
| 7. Modelos suportados | Multi-vendor: OpenAI, Anthropic, OpenRouter, vLLM local, Doubao, DeepSeek, Kimi | Anthropic (Claude) apenas | Google (Gemini) apenas |
| 8. Interface | Web (Next.js), API, IM (Telegram, Slack, Feishu, WeChat, WeCom) | CLI + extensões IDE (VS Code, JetBrains) + web | Editor dedicado (desktop) |
| 9. Open source? | Sim, repositório público, licença permissiva | Parcial · CLI fechada, SDK e partes abertas | Fechado |
| 10. Público-alvo primário | Times que hospedam e estendem o harness para research, mídia, análise, IM | Devs e times de engenharia de software | Devs que querem IDE-first com agentes autônomos |
Leitura: a coluna amber destaca DeerFlow só para ajudar o olho — não implica vantagem. Células da mesma linha que dizem coisas diferentes normalmente significam escopo diferente, não "melhor/pior".
📈 Gráficos comparativos
Cinco dimensões visualmente. Escala 1 = mínimo, 5 = máximo naquela dimensão específica. Leia uma por uma.
🛡️ Isolamento de sandbox
1 = sem isolamento · 5 = pronto para multi-tenantLocal/Docker/K8s configurável · quotas, policies, multi-tenant real.
Executa no host; confia no dev. Approval prompts, mas sem isolamento real.
Sandbox do fornecedor (cloud-side), não auditável pelo usuário.
🧠 Profundidade de memória
1 = stateless · 5 = long-term categorizadaLong-term de 1ª classe, 4 categorias, revisável pelo usuário.
File-based (CLAUDE.md + memory tool), persistente por projeto, sem categorização nativa.
Session + persistência leve no workspace; long-term ainda amadurecendo.
🧩 Extensibilidade
1 = fechada · 5 = múltiplas formas plugáveisSkills + tools + custom agents com SOUL + MCP + providers — cinco pontos de extensão.
Skills oficiais + MCP servers + hooks + settings. DX madura, catálogo crescendo.
Extensões dentro do editor, catálogo público pequeno em 2026.
🌐 Cobertura fora de código
1 = só engenharia · 5 = research / mídia / análise / IMSkills maduras para research, PPT, podcast, newsletter, vídeo, análise, IM nativo.
Centro de gravidade em engenharia de software; fora disso é possível, mas não é forte.
IDE-first; foco em desenvolvimento de software dentro do editor.
🔒 Data residency e controle
1 = cloud only · 5 = self-hosted completoSelf-hosted; dados, memória, sandbox e traces em infra sua. vLLM local fecha o circuito.
Contexto local, mas chamadas de modelo saem para Anthropic. Bom para código, fraco para dados regulados.
Cloud-first; data residency estrita fica difícil de garantir.
💡 Como usar os gráficos na decisão
Escolha 2 ou 3 dimensões que importam para o seu caso e some os scores só delas. Ignore as outras. Exemplos:
- →Engenharia de software pura: priorize extensibilidade + sub-agentes + sandbox razoável — Claude Code e Antigravity brigam aqui.
- →Research + mídia + IM: priorize cobertura fora de código + memória long-term — DeerFlow vence naturalmente.
- →Dados regulados / compliance: priorize data residency + isolamento de sandbox — DeerFlow self-hosted é o único viável.
📝 Resumo do Módulo
Próximo Módulo:
4.2 — 🎯 Posicionamento das 3 plataformas
O "esqueleto honesto" do curso: Claude Code, Antigravity e DeerFlow 2.0 em uma frase cada. Termina com um lab-relâmpago dizendo "oi" nas três.