Tips & Tricks

Guia de Velocidade do Claude Code | Por que é Lento e Como Tornei 3x Mais Rápido

Identifique por que o Claude Code fica lento e aprenda as configurações, design de prompts e técnicas de execução paralela que triplicaram minha velocidade de verdade. Otimizações reais do uso diário.

“O Claude Code está ficando mais lento ultimamente?”

Automatizo a geração de artigos para este site com o Claude Code todos os dias, e tive a mesma frustração na primeira semana. O que costumava levar 15 minutos por artigo caiu para uma média de 4–5 minutos após ajustar a configuração — cerca de 3 vezes mais rápido.

Neste artigo, vou cobrir as causas fundamentais de por que o Claude Code fica lento e as técnicas de otimização de velocidade que realmente testei e achei eficazes. Em vez de apenas “como torná-lo mais rápido,” quero que você entenda por que cada técnica funciona.

Por que o Claude Code Fica Lento?

Antes de otimizar, é preciso entender as causas. Há três razões principais pelas quais o Claude Code parece lento.

Causa 1: O Contexto Está Inflando

O Claude Code chama a API com todo o histórico de conversa como contexto. Quanto mais longa a sessão, mais dados são enviados a cada vez, e mais lentas ficam as respostas.

Logo após iniciar a sessão: contexto ~2.000 tokens  → rápido
Após 1 hora:                contexto ~30.000 tokens → lento
Após meio dia:              contexto ~80.000 tokens → muito lento (ou erros)

Na minha experiência, quando o contexto ultrapassa 50.000 tokens, a velocidade percebida cai para menos da metade.

Causa 2: Muitos Arquivos Sendo Lidos

Dar instruções como "Leia o repositório inteiro e entenda-o antes de implementar" faz com que o Claude Code tente ler um grande número de arquivos. O tempo de espera quando ele executa dezenas de comandos Glob e Grep é quase inteiramente “tempo gasto lendo arquivos.”

Causa 3: Carga de Processamento do Modelo

O Opus é poderoso, mas leva mais tempo para gerar respostas. Muitas tarefas usam o Opus desnecessariamente — isso é exagero para a tarefa em questão.


Solução 1: Tornar /compact um Hábito

A solução com efeito mais imediato. O Claude Code tem um comando /compact que comprime e resume o histórico de conversa, reduzindo drasticamente o tamanho do contexto.

# Executar dentro do REPL do Claude Code
/compact

Criei o hábito de executar /compact uma vez por hora ou a cada pausa natural no trabalho. Só isso melhora a velocidade percebida em 1,5–2 vezes.

Iniciar Novas Tarefas em uma Nova Sessão

Para novas tarefas que não precisam do contexto do trabalho anterior, reiniciar o Claude Code e iniciar uma sessão nova é mais rápido. A reinicialização leva menos de 5 segundos.

# Sair e reiniciar
exit
claude

Quando você quer referenciar trabalho anterior, colar apenas as informações relevantes após /init é mais rápido e preciso no final do que carregar um longo histórico de conversa.


Solução 2: Limitar Explicitamente o Escopo das Instruções

Reduzir leituras desnecessárias de arquivos leva a ganhos de velocidade significativos.

Comparação Before / After

# ❌ Lento: escopo muito amplo
claude -p "Conserte o bug neste projeto"
# → Glob → Read × dezenas de vezes → demora uma eternidade

# ✅ Rápido: escopo limitado
claude -p "Conserte a verificação null faltando na linha 108 de src/api/auth.ts"
# → Read 1 vez → correção concluída

Um padrão que uso frequentemente:

# Pedir para ler apenas arquivos específicos
claude -p "Leia apenas os arquivos abaixo e resolva o problema. Não precisa ler mais nada:
- src/components/Button.tsx
- src/styles/button.css
Problema: os estilos de hover não estão sendo aplicados"

Adicionar “não precisa ler mais nada” interrompe o comportamento de exploração desnecessária.


Solução 3: Usar o Modelo Certo para Cada Tarefa

Usar o Opus para todas as tarefas é um desperdício em termos de velocidade.

Opus:   Design complexo · debugging difícil · revisão de código
Sonnet: Implementação geral · refatoração · documentação
Haiku:  Tradução · formatação · transformações simples

Trocar de Modelo no Claude Code

# Trocar o modelo durante uma sessão
/model claude-sonnet-4-6

# Nota de velocidade: o Sonnet é aproximadamente 2–3 vezes mais rápido que o Opus na prática

Para as operações do meu site:

  • Corpo do artigo em japonês → Sonnet (qualidade de estrutura suficiente, mais rápido que o Opus)
  • Tradução multilíngue → Haiku (qualidade de tradução perfeitamente utilizável, dramaticamente mais rápido)
  • Discussões de design · implementação complexa → Opus (qualidade em primeiro lugar apenas aqui)

Essa divisão reduziu o tempo de geração por artigo de 15 minutos para 4 minutos.


Solução 4: Execução Paralela com Sub-Agentes

Paralelizar o processamento pesado pode reduzir drasticamente o tempo total.

Tradução Paralela (o método que realmente uso)

// ❌ Tradução sequencial: 9 idiomas × 30 segundos = 270 segundos (4,5 min.)
for (const lang of languages) {
  await translate(article, lang);
}

// ✅ Delegação paralela com Agent tool: tempo = idioma mais lento ≈ 30 segundos
// (Este site passou de 8 min. para 1,5 min. delegando em massa para sub-agentes)
Agent({
  prompt: `Traduza ${article} para 9 idiomas e salve cada arquivo: EN/DE/ES/FR/HI/ID/KO/PT/ZH`
})

Os sub-agentes rodam em seu próprio contexto independente, portanto não contaminam o contexto principal. Isso também contribui para a melhoria de velocidade.


Solução 5: Acelerar a Entrada com Cache de Prompts

Quando você reutiliza o mesmo system prompt repetidamente, o cache de prompts torna o processamento de entrada aproximadamente 10 vezes mais rápido. Isso tem um efeito notável na velocidade percebida.

// Basta adicionar cache_control
system: [
  {
    type: "text",
    text: longSystemPrompt,
    cache_control: { type: "ephemeral" },
  },
],

Quando você reutiliza o mesmo system prompt dentro de 5 minutos, a segunda chamada em diante é visivelmente mais rápida que a primeira.


Solução 6: Reduzir Explorações Desnecessárias com CLAUDE.md

Escrever “comandos a usar,” “estrutura de diretórios” e regras de “não leia” no CLAUDE.md permite que o Claude Code aja diretamente sem vagar.

# Regras do Projeto

## Comandos Frequentemente Usados (não precisa pesquisar toda vez)
- Build: npm run build
- Test: npm run test
- Deploy: bash scripts/deploy.sh

## Estrutura de Diretórios
- src/components/: componentes de UI
- src/pages/: roteamento
- src/content/blog/: artigos do blog (MDX)

## Importante: NÃO leia estes diretórios
- node_modules/
- .wrangler/
- site/dist/

Isso reduz o número de turnos que o Claude Code passa descobrindo “onde devo procurar?”, o que acelera o processo como um todo.


Números Reais de Melhoria de Velocidade (Este Site)

Para referência, aqui estão os resultados reais deste site (claudecode-lab.com).

TarefaAntes da OtimizaçãoApós a OtimizaçãoRedução
Geração de artigo (japonês)8 min.2,5 min.69% mais rápido
Tradução em 9 idiomas7 min.1,5 min.79% mais rápido
Build + deploy13 min.11 min.15% mais rápido
Total (por artigo)28 min.15 min.46% mais rápido

Aplicando rigorosamente /compact e o gerenciamento de sessão, o site agora roda de forma estável a 10–12 minutos por artigo.


Lista de Verificação de Otimização de Velocidade

Na ordem do que verificar primeiro.

Fazer agora (menos de 1 minuto):
□ Executar /compact para compactar o contexto
□ Reiniciar uma sessão que está rodando há muito tempo
□ Mudar tarefas de tradução/formatação para o Haiku

Fazer hoje (30 minutos):
□ Adicionar "diretórios que não devem ser lidos" ao CLAUDE.md
□ Adicionar comandos frequentemente usados ao CLAUDE.md
□ Desenvolver o hábito de quebrar tarefas grandes em "tarefas menores com escopo limitado"

Fazer esta semana:
□ Adicionar cache_control a processos batch repetidos
□ Criar padrões para delegar tarefas paralelizáveis ao Agent tool
□ Definir regras de uso de modelos e adicioná-las ao CLAUDE.md

Resumo

As causas fundamentais da lentidão do Claude Code são “a inflação do contexto” e “a exploração ineficiente de arquivos.” Apenas estar ciente desses dois pontos faz uma grande diferença na velocidade percebida.

Minha lista priorizada das melhorias mais impactantes:

  1. Tornar /compact um hábito (efeito imediato, custo zero)
  2. Usar o modelo certo para cada tarefa (mudar apenas a tradução para Haiku já é dramático)
  3. Limitar explicitamente o escopo das instruções (simplesmente adicionar “não precisa ler mais nada”)
  4. Delegação paralela para sub-agentes

Não é necessário fazer tudo isso de uma vez. Apenas incorporar /compact no trabalho de hoje já deve parecer visivelmente mais rápido.

Artigos Relacionados

#claude-code #performance #optimization #prompt-engineering #productivity

Leve seu fluxo no Claude Code a outro nível

50 modelos de prompt testados em campo, prontos para colar direto no Claude Code.

Grátis

PDF gratuito: Cheatsheet do Claude Code em 5 minutos

Basta informar seu e-mail e enviamos na hora o cheatsheet em uma página A4.

Cuidamos dos seus dados pessoais e nunca enviamos spam.

Masa

Sobre o autor

Masa

Engenheiro apaixonado por Claude Code. Mantém o claudecode-lab.com, uma mídia tech em 10 idiomas com mais de 2.000 páginas.