Tips & Tricks

Guía de velocidad de Claude Code | Por qué es lento y cómo lo hice 3 veces más rápido

Identifica por qué Claude Code se vuelve lento y aprende las configuraciones, diseño de prompts y técnicas de ejecución paralela que triplicaron mi velocidad. Optimizaciones reales del uso diario.

“¿Claude Code se está volviendo más lento últimamente?”

Automatizo la generación de artículos para este sitio con Claude Code todos los días, y tuve la misma frustración durante la primera semana. Lo que solía tardar 15 minutos por artículo bajó a un promedio de 4–5 minutos después de ajustar la configuración, es decir, unas 3 veces más rápido.

En este artículo explico las causas fundamentales de por qué Claude Code se vuelve lento y las técnicas de optimización de velocidad que probé y encontré efectivas. En lugar de solo explicar “cómo hacerlo más rápido,” quiero que entiendas por qué funciona cada técnica.

¿Por qué se vuelve lento Claude Code?

Antes de optimizar, hay que entender las causas. Hay tres razones principales por las que Claude Code se siente lento.

Causa 1: El contexto se infla demasiado

Claude Code llama a la API con todo el historial de conversación como contexto. Cuanto más larga es la sesión, más datos envía cada vez y más lentas se vuelven las respuestas.

Justo después de iniciar la sesión: contexto ~2.000 tokens  → rápido
Después de 1 hora:                  contexto ~30.000 tokens → lento
Después de medio día:               contexto ~80.000 tokens → muy lento (o errores)

En mi experiencia, cuando el contexto supera los 50.000 tokens, la velocidad percibida cae a menos de la mitad.

Causa 2: Se leen demasiados archivos

Dar instrucciones como "Lee todo el repositorio y entiéndelo antes de implementar" hace que Claude Code intente leer una gran cantidad de archivos. El tiempo de espera cuando ejecuta docenas de comandos Glob y Grep es casi en su totalidad “tiempo dedicado a leer archivos.”

Causa 3: Carga de procesamiento del modelo

Opus es potente, pero tarda más en generar respuestas. Muchas tareas usan Opus cuando no lo necesitan — eso es exceso de capacidad para la tarea en cuestión.


Solución 1: Hacer de /compact un hábito

La solución con efecto más inmediato. Claude Code tiene un comando /compact que comprime y resume el historial de conversación, reduciendo drásticamente el tamaño del contexto.

# Ejecutar dentro del REPL de Claude Code
/compact

Me acostumbré a ejecutar /compact una vez por hora o en cada pausa natural del trabajo. Solo esto mejora la velocidad percibida entre 1,5 y 2 veces.

Iniciar nuevas tareas en una nueva sesión

Para nuevas tareas que no necesitan el contexto del trabajo anterior, reiniciar Claude Code e iniciar una sesión nueva es más rápido. El reinicio tarda menos de 5 segundos.

# Salir y reiniciar
exit
claude

Cuando sí quieres hacer referencia al trabajo anterior, pegar solo la información relevante después de /init resulta más rápido y preciso que arrastrar un historial de conversación largo.


Solución 2: Limitar explícitamente el alcance de las instrucciones

Reducir las lecturas de archivos innecesarias conduce a ganancias de velocidad significativas.

Comparación Before / After

# ❌ Lento: alcance demasiado amplio
claude -p "Arregla el bug en este proyecto"
# → Glob → Read × decenas de veces → tarda una eternidad

# ✅ Rápido: alcance limitado
claude -p "Arregla la validación nula faltante en la línea 108 de src/api/auth.ts"
# → Read 1 vez → corrección completada

Un patrón que uso con frecuencia:

# Hacer que lea solo archivos específicos
claude -p "Lee solo los siguientes archivos y soluciona el problema. No necesitas leer nada más:
- src/components/Button.tsx
- src/styles/button.css
Problema: los estilos de hover no se aplican"

Agregar “no necesitas leer nada más” detiene el comportamiento de exploración innecesaria.


Solución 3: Usar el modelo correcto para cada tarea

Usar Opus para cada tarea es un desperdicio en términos de velocidad.

Opus:   Diseño complejo · depuración difícil · revisión de código
Sonnet: Implementación general · refactorización · documentación
Haiku:  Traducción · formateo · transformaciones simples

Cambiar de modelo en Claude Code

# Cambiar el modelo durante una sesión
/model claude-sonnet-4-6

# Nota de velocidad: Sonnet es aproximadamente 2–3 veces más rápido que Opus en la práctica

Para las operaciones de mi sitio:

  • Cuerpo del artículo en japonés → Sonnet (calidad de estructura suficiente, más rápido que Opus)
  • Traducción a múltiples idiomas → Haiku (calidad de traducción perfectamente utilizable, dramáticamente más rápido)
  • Discusiones de diseño · implementación compleja → Opus (solo aquí priorizo la calidad)

Esta división llevó el tiempo de generación por artículo de 15 minutos a 4 minutos.


Solución 4: Ejecución paralela con sub-agentes

Paralelizar el procesamiento pesado puede reducir drásticamente el tiempo total.

Traducción paralela (el método que realmente uso)

// ❌ Traducción secuencial: 9 idiomas × 30 segundos = 270 segundos (4,5 min.)
for (const lang of languages) {
  await translate(article, lang);
}

// ✅ Delegación paralela con Agent tool: tiempo = idioma más lento ≈ 30 segundos
// (Este sitio pasó de 8 min. a 1,5 min. delegando todo en bloque a sub-agentes)
Agent({
  prompt: `Traduce ${article} a 9 idiomas y guarda cada archivo: EN/DE/ES/FR/HI/ID/KO/PT/ZH`
})

Los sub-agentes operan en su propio contexto independiente, por lo que no contaminan el contexto principal. Esto también contribuye a la mejora de velocidad.


Solución 5: Acelerar la entrada con caché de prompts

Cuando reutilizas el mismo system prompt repetidamente, el caché de prompts hace que el procesamiento de entrada sea aproximadamente 10 veces más rápido. Esto tiene un efecto notable en la velocidad percibida.

// Solo agrega cache_control
system: [
  {
    type: "text",
    text: longSystemPrompt,
    cache_control: { type: "ephemeral" },
  },
],

Cuando reutilizas el mismo system prompt dentro de 5 minutos, la segunda llamada en adelante es notablemente más rápida que la primera.


Solución 6: Reducir exploraciones innecesarias con CLAUDE.md

Escribir “comandos a usar,” “estructura de directorios” y reglas de “no leer” en CLAUDE.md permite a Claude Code actuar directamente sin divagar.

# Reglas del proyecto

## Comandos de uso frecuente (no es necesario buscarlos cada vez)
- Build: npm run build
- Test: npm run test
- Deploy: bash scripts/deploy.sh

## Estructura de directorios
- src/components/: componentes UI
- src/pages/: enrutamiento
- src/content/blog/: artículos del blog (MDX)

## Importante: NO leer estos directorios
- node_modules/
- .wrangler/
- site/dist/

Esto reduce el número de turnos que Claude Code dedica a averiguar “¿dónde debo mirar?”, lo que acelera el proceso en general.


Números reales de mejora de velocidad (este sitio)

Como referencia, aquí están los resultados reales de este sitio (claudecode-lab.com).

TareaAntes de la optimizaciónDespués de la optimizaciónReducción
Generación de artículo (japonés)8 min.2,5 min.69% más rápido
Traducción a 9 idiomas7 min.1,5 min.79% más rápido
Build + deploy13 min.11 min.15% más rápido
Total (por artículo)28 min.15 min.46% más rápido

Aplicando rigurosamente /compact y la gestión de sesiones, el sitio ahora funciona de manera estable con 10–12 minutos por artículo.


Lista de verificación de optimización de velocidad

En el orden en que se deben revisar primero.

Hacer ahora mismo (menos de 1 minuto):
□ Ejecutar /compact para comprimir el contexto
□ Reiniciar una sesión que lleva mucho tiempo ejecutándose
□ Cambiar tareas de traducción/formato a Haiku

Hacer hoy (30 minutos):
□ Agregar "directorios que no se deben leer" a CLAUDE.md
□ Agregar comandos de uso frecuente a CLAUDE.md
□ Desarrollar el hábito de dividir tareas grandes en "pequeñas tareas de alcance limitado"

Hacer esta semana:
□ Agregar cache_control a procesos batch repetidos
□ Crear patrones para delegar tareas paralelizables al Agent tool
□ Definir reglas de uso de modelos y agregarlas a CLAUDE.md

Resumen

Las causas fundamentales de la lentitud de Claude Code son “la inflación del contexto” y “la exploración ineficiente de archivos.” Solo ser consciente de estos dos puntos marca una gran diferencia en la velocidad percibida.

Mi lista priorizada de las mejoras más impactantes:

  1. Hacer de /compact un hábito (efecto inmediato, costo cero)
  2. Usar el modelo correcto para cada tarea (solo cambiar la traducción a Haiku es dramático)
  3. Limitar explícitamente el alcance de las instrucciones (simplemente agregar “no necesitas leer nada más”)
  4. Delegación paralela a sub-agentes

No es necesario hacer todo esto a la vez. Solo incorporar /compact al trabajo de hoy ya debería sentirse notablemente más rápido.

Artículos relacionados

#claude-code #performance #optimization #prompt-engineering #productivity

Lleva tu flujo con Claude Code al siguiente nivel

50 plantillas de prompts probadas en producción, listas para copiar y pegar en Claude Code.

Gratis

PDF gratuito: Hoja de trucos de Claude Code en 5 minutos

Solo deja tu correo y te enviaremos al instante la hoja de trucos en una página A4.

Cuidamos tus datos personales y nunca enviamos spam.

Masa

Sobre el autor

Masa

Ingeniero apasionado por Claude Code. Dirige claudecode-lab.com, un medio tecnológico en 10 idiomas con más de 2.000 páginas.