Guia de Velocidade do Claude Code | Por que é Lento e Como Tornei 3x Mais Rápido
Identifique por que o Claude Code fica lento e aprenda as configurações, design de prompts e técnicas de execução paralela que triplicaram minha velocidade de verdade. Otimizações reais do uso diário.
“O Claude Code está ficando mais lento ultimamente?”
Automatizo a geração de artigos para este site com o Claude Code todos os dias, e tive a mesma frustração na primeira semana. O que costumava levar 15 minutos por artigo caiu para uma média de 4–5 minutos após ajustar a configuração — cerca de 3 vezes mais rápido.
Neste artigo, vou cobrir as causas fundamentais de por que o Claude Code fica lento e as técnicas de otimização de velocidade que realmente testei e achei eficazes. Em vez de apenas “como torná-lo mais rápido,” quero que você entenda por que cada técnica funciona.
Por que o Claude Code Fica Lento?
Antes de otimizar, é preciso entender as causas. Há três razões principais pelas quais o Claude Code parece lento.
Causa 1: O Contexto Está Inflando
O Claude Code chama a API com todo o histórico de conversa como contexto. Quanto mais longa a sessão, mais dados são enviados a cada vez, e mais lentas ficam as respostas.
Logo após iniciar a sessão: contexto ~2.000 tokens → rápido
Após 1 hora: contexto ~30.000 tokens → lento
Após meio dia: contexto ~80.000 tokens → muito lento (ou erros)
Na minha experiência, quando o contexto ultrapassa 50.000 tokens, a velocidade percebida cai para menos da metade.
Causa 2: Muitos Arquivos Sendo Lidos
Dar instruções como "Leia o repositório inteiro e entenda-o antes de implementar" faz com que o Claude Code tente ler um grande número de arquivos. O tempo de espera quando ele executa dezenas de comandos Glob e Grep é quase inteiramente “tempo gasto lendo arquivos.”
Causa 3: Carga de Processamento do Modelo
O Opus é poderoso, mas leva mais tempo para gerar respostas. Muitas tarefas usam o Opus desnecessariamente — isso é exagero para a tarefa em questão.
Solução 1: Tornar /compact um Hábito
A solução com efeito mais imediato. O Claude Code tem um comando /compact que comprime e resume o histórico de conversa, reduzindo drasticamente o tamanho do contexto.
# Executar dentro do REPL do Claude Code
/compact
Criei o hábito de executar /compact uma vez por hora ou a cada pausa natural no trabalho. Só isso melhora a velocidade percebida em 1,5–2 vezes.
Iniciar Novas Tarefas em uma Nova Sessão
Para novas tarefas que não precisam do contexto do trabalho anterior, reiniciar o Claude Code e iniciar uma sessão nova é mais rápido. A reinicialização leva menos de 5 segundos.
# Sair e reiniciar
exit
claude
Quando você quer referenciar trabalho anterior, colar apenas as informações relevantes após /init é mais rápido e preciso no final do que carregar um longo histórico de conversa.
Solução 2: Limitar Explicitamente o Escopo das Instruções
Reduzir leituras desnecessárias de arquivos leva a ganhos de velocidade significativos.
Comparação Before / After
# ❌ Lento: escopo muito amplo
claude -p "Conserte o bug neste projeto"
# → Glob → Read × dezenas de vezes → demora uma eternidade
# ✅ Rápido: escopo limitado
claude -p "Conserte a verificação null faltando na linha 108 de src/api/auth.ts"
# → Read 1 vez → correção concluída
Um padrão que uso frequentemente:
# Pedir para ler apenas arquivos específicos
claude -p "Leia apenas os arquivos abaixo e resolva o problema. Não precisa ler mais nada:
- src/components/Button.tsx
- src/styles/button.css
Problema: os estilos de hover não estão sendo aplicados"
Adicionar “não precisa ler mais nada” interrompe o comportamento de exploração desnecessária.
Solução 3: Usar o Modelo Certo para Cada Tarefa
Usar o Opus para todas as tarefas é um desperdício em termos de velocidade.
Opus: Design complexo · debugging difícil · revisão de código
Sonnet: Implementação geral · refatoração · documentação
Haiku: Tradução · formatação · transformações simples
Trocar de Modelo no Claude Code
# Trocar o modelo durante uma sessão
/model claude-sonnet-4-6
# Nota de velocidade: o Sonnet é aproximadamente 2–3 vezes mais rápido que o Opus na prática
Para as operações do meu site:
- Corpo do artigo em japonês → Sonnet (qualidade de estrutura suficiente, mais rápido que o Opus)
- Tradução multilíngue → Haiku (qualidade de tradução perfeitamente utilizável, dramaticamente mais rápido)
- Discussões de design · implementação complexa → Opus (qualidade em primeiro lugar apenas aqui)
Essa divisão reduziu o tempo de geração por artigo de 15 minutos para 4 minutos.
Solução 4: Execução Paralela com Sub-Agentes
Paralelizar o processamento pesado pode reduzir drasticamente o tempo total.
Tradução Paralela (o método que realmente uso)
// ❌ Tradução sequencial: 9 idiomas × 30 segundos = 270 segundos (4,5 min.)
for (const lang of languages) {
await translate(article, lang);
}
// ✅ Delegação paralela com Agent tool: tempo = idioma mais lento ≈ 30 segundos
// (Este site passou de 8 min. para 1,5 min. delegando em massa para sub-agentes)
Agent({
prompt: `Traduza ${article} para 9 idiomas e salve cada arquivo: EN/DE/ES/FR/HI/ID/KO/PT/ZH`
})
Os sub-agentes rodam em seu próprio contexto independente, portanto não contaminam o contexto principal. Isso também contribui para a melhoria de velocidade.
Solução 5: Acelerar a Entrada com Cache de Prompts
Quando você reutiliza o mesmo system prompt repetidamente, o cache de prompts torna o processamento de entrada aproximadamente 10 vezes mais rápido. Isso tem um efeito notável na velocidade percebida.
// Basta adicionar cache_control
system: [
{
type: "text",
text: longSystemPrompt,
cache_control: { type: "ephemeral" },
},
],
Quando você reutiliza o mesmo system prompt dentro de 5 minutos, a segunda chamada em diante é visivelmente mais rápida que a primeira.
Solução 6: Reduzir Explorações Desnecessárias com CLAUDE.md
Escrever “comandos a usar,” “estrutura de diretórios” e regras de “não leia” no CLAUDE.md permite que o Claude Code aja diretamente sem vagar.
# Regras do Projeto
## Comandos Frequentemente Usados (não precisa pesquisar toda vez)
- Build: npm run build
- Test: npm run test
- Deploy: bash scripts/deploy.sh
## Estrutura de Diretórios
- src/components/: componentes de UI
- src/pages/: roteamento
- src/content/blog/: artigos do blog (MDX)
## Importante: NÃO leia estes diretórios
- node_modules/
- .wrangler/
- site/dist/
Isso reduz o número de turnos que o Claude Code passa descobrindo “onde devo procurar?”, o que acelera o processo como um todo.
Números Reais de Melhoria de Velocidade (Este Site)
Para referência, aqui estão os resultados reais deste site (claudecode-lab.com).
| Tarefa | Antes da Otimização | Após a Otimização | Redução |
|---|---|---|---|
| Geração de artigo (japonês) | 8 min. | 2,5 min. | 69% mais rápido |
| Tradução em 9 idiomas | 7 min. | 1,5 min. | 79% mais rápido |
| Build + deploy | 13 min. | 11 min. | 15% mais rápido |
| Total (por artigo) | 28 min. | 15 min. | 46% mais rápido |
Aplicando rigorosamente /compact e o gerenciamento de sessão, o site agora roda de forma estável a 10–12 minutos por artigo.
Lista de Verificação de Otimização de Velocidade
Na ordem do que verificar primeiro.
Fazer agora (menos de 1 minuto):
□ Executar /compact para compactar o contexto
□ Reiniciar uma sessão que está rodando há muito tempo
□ Mudar tarefas de tradução/formatação para o Haiku
Fazer hoje (30 minutos):
□ Adicionar "diretórios que não devem ser lidos" ao CLAUDE.md
□ Adicionar comandos frequentemente usados ao CLAUDE.md
□ Desenvolver o hábito de quebrar tarefas grandes em "tarefas menores com escopo limitado"
Fazer esta semana:
□ Adicionar cache_control a processos batch repetidos
□ Criar padrões para delegar tarefas paralelizáveis ao Agent tool
□ Definir regras de uso de modelos e adicioná-las ao CLAUDE.md
Resumo
As causas fundamentais da lentidão do Claude Code são “a inflação do contexto” e “a exploração ineficiente de arquivos.” Apenas estar ciente desses dois pontos faz uma grande diferença na velocidade percebida.
Minha lista priorizada das melhorias mais impactantes:
- Tornar
/compactum hábito (efeito imediato, custo zero) - Usar o modelo certo para cada tarefa (mudar apenas a tradução para Haiku já é dramático)
- Limitar explicitamente o escopo das instruções (simplesmente adicionar “não precisa ler mais nada”)
- Delegação paralela para sub-agentes
Não é necessário fazer tudo isso de uma vez. Apenas incorporar /compact no trabalho de hoje já deve parecer visivelmente mais rápido.
Artigos Relacionados
Leve seu fluxo no Claude Code a outro nível
50 modelos de prompt testados em campo, prontos para colar direto no Claude Code.
PDF gratuito: Cheatsheet do Claude Code em 5 minutos
Basta informar seu e-mail e enviamos na hora o cheatsheet em uma página A4.
Cuidamos dos seus dados pessoais e nunca enviamos spam.
Sobre o autor
Masa
Engenheiro apaixonado por Claude Code. Mantém o claudecode-lab.com, uma mídia tech em 10 idiomas com mais de 2.000 páginas.
Artigos relacionados
Domine os custos da API do Claude Code: 5 técnicas para cair de $450 para $45/mês
Os números reais por trás dos preços da API do Claude Code. Veja como o prompt caching, a otimização de modelos e o processamento em lotes alcançaram 90% de redução—de $450 para $45 por mês.
7 Incidentes Reais em Produção com Claude Code: Recuperação Completa com RCA e Prevenção
7 incidentes reais em produção com Claude Code: vazamento de chaves API, exclusão de BD, explosão de cobrança e quedas de serviço — com análise de causa raiz e estratégias de prevenção.
10 Padrões de Prompts Perigosos no Claude Code | O Que Evitar e Alternativas Seguras
Descubra 10 padrões de prompts perigosos que você nunca deve dar ao Claude Code. Saiba como instruções vagas causam perda de código, destruição de BD, contas absurdas e vazamento de chaves.