Tips & Tricks

Claude Code स्पीड गाइड | धीमा क्यों होता है और इसे 3 गुना तेज़ कैसे बनाया

Claude Code के धीमे होने के कारण खोजें और वे सेटिंग्स, प्रॉम्प्ट डिज़ाइन और समानांतर निष्पादन तकनीकें जानें जिन्होंने वाकई मेरी गति तीन गुना कर दी। दैनिक उपयोग से निकले असली अनुभव।

“क्या Claude Code हाल ही में धीमा हो गया है?”

मैं हर दिन Claude Code से इस साइट के लेख स्वचालित रूप से बनाता हूँ, और पहले हफ्ते में मुझे भी यही परेशानी थी। पहले प्रति लेख 15 मिनट लगते थे, लेकिन सेटअप ठीक करने के बाद यह औसतन 4–5 मिनट रह गया — यानी लगभग 3 गुना तेज़।

इस लेख में, मैं Claude Code के धीमे होने के मूल कारण और उन स्पीड ऑप्टिमाइज़ेशन तकनीकों को समझाऊँगा जो मैंने वास्तव में आज़माकर प्रभावी पाईं। सिर्फ “इसे तेज़ करने का तरीका” नहीं, बल्कि क्यों काम करती है, यह भी समझाऊँगा।

Claude Code धीमा क्यों होता है?

ऑप्टिमाइज़ करने से पहले कारण समझना ज़रूरी है। Claude Code के धीमे लगने के तीन मुख्य कारण हैं।

कारण 1: कॉन्टेक्स्ट का फूलना

Claude Code पूरे बातचीत के इतिहास को कॉन्टेक्स्ट के रूप में API को भेजता है। सेशन जितना लंबा होता है, हर बार उतना ज़्यादा डेटा भेजा जाता है, और रिस्पॉन्स उतना ही धीमा होता है।

सेशन शुरू होने के तुरंत बाद: कॉन्टेक्स्ट ~2,000 tokens  → तेज़
1 घंटे बाद:                    कॉन्टेक्स्ट ~30,000 tokens → धीमा
आधे दिन बाद:                   कॉन्टेक्स्ट ~80,000 tokens → बहुत धीमा (या error)

मेरे अनुभव में, जब कॉन्टेक्स्ट 50,000 tokens से अधिक हो जाता है, तो महसूस की गई गति आधी से कम हो जाती है

कारण 2: बहुत ज़्यादा फ़ाइलें पढ़ना

"पूरी रिपॉज़िटरी पढ़ो और समझो फिर implement करो" जैसे निर्देश देने पर Claude Code बड़ी संख्या में फ़ाइलें पढ़ने की कोशिश करता है। जब दर्जनों Glob और Grep कमांड चलते हैं, वह लगभग पूरा इंतज़ार “फ़ाइलें पढ़ने में बिताया गया समय” होता है।

कारण 3: मॉडल की प्रोसेसिंग लोड

Opus शक्तिशाली है, लेकिन रिस्पॉन्स जनरेट करने में अधिक समय लगता है। कई टास्क बिना ज़रूरत के Opus उपयोग करते हैं — यह उस काम के लिए ज़रूरत से ज़्यादा है।


उपाय 1: /compact को आदत बनाएँ

सबसे तुरंत असर करने वाला उपाय। Claude Code में /compact कमांड है जो बातचीत के इतिहास को compress और summarize करता है, जिससे कॉन्टेक्स्ट का आकार बहुत कम हो जाता है।

# Claude Code REPL में चलाएँ
/compact

मैंने हर घंटे या काम की हर स्वाभाविक विराम पर /compact चलाने की आदत बना ली है। इससे अकेले महसूस की गई गति 1.5–2 गुना बेहतर हो जाती है।

नए काम के लिए नया सेशन शुरू करें

ऐसे नए काम जिन्हें पिछले काम के कॉन्टेक्स्ट की ज़रूरत नहीं, उनके लिए Claude Code को restart करके नया सेशन शुरू करना तेज़ होता है। Restart में 5 सेकंड से कम लगता है।

# बंद करें और restart करें
exit
claude

जब पिछले काम को देखना हो, तो /init के बाद केवल ज़रूरी जानकारी paste करना लंबे बातचीत के इतिहास को आगे ले जाने से अंततः तेज़ और सटीक होता है।


उपाय 2: निर्देशों का दायरा स्पष्ट रूप से सीमित करें

अनावश्यक फ़ाइल पढ़ने को कम करने से गति में बड़ा सुधार होता है।

Before / After तुलना

# ❌ धीमा: दायरा बहुत बड़ा
claude -p "इस प्रोजेक्ट में bug ठीक करो"
# → Glob → Read × दर्जनों बार → बहुत समय लगता है

# ✅ तेज़: दायरा सीमित
claude -p "src/api/auth.ts की लाइन 108 पर null check की कमी ठीक करो"
# → Read 1 बार → सुधार पूरा

मेरा अक्सर इस्तेमाल होने वाला पैटर्न:

# केवल विशिष्ट फ़ाइलें पढ़ाएँ
claude -p "केवल नीचे दी गई फ़ाइलें पढ़ो और समस्या ठीक करो। और कुछ पढ़ने की ज़रूरत नहीं:
- src/components/Button.tsx
- src/styles/button.css
समस्या: hover styles लागू नहीं हो रहे"

“और कुछ पढ़ने की ज़रूरत नहीं” जोड़ने से अनावश्यक खोज का व्यवहार रुक जाता है।


उपाय 3: काम के हिसाब से सही मॉडल उपयोग करें

हर काम के लिए Opus उपयोग करना गति के लिहाज़ से फ़िज़ूलखर्ची है।

Opus:   जटिल design · कठिन debugging · code review
Sonnet: सामान्य implementation · refactoring · documentation
Haiku:  अनुवाद · formatting · सरल transformations

Claude Code में मॉडल बदलें

# सेशन के दौरान मॉडल बदलें
/model claude-sonnet-4-6

# गति की जानकारी: Sonnet व्यवहार में Opus से लगभग 2–3 गुना तेज़ है

मेरी साइट के संचालन के लिए:

  • जापानी लेख का मुख्य भाग → Sonnet (संरचना की गुणवत्ता पर्याप्त, Opus से तेज़)
  • बहुभाषी अनुवाद → Haiku (अनुवाद की गुणवत्ता पूरी तरह उपयोगी, नाटकीय रूप से तेज़)
  • Design चर्चा · जटिल implementation → Opus (केवल यहाँ गुणवत्ता को प्राथमिकता)

इस विभाजन से प्रति लेख generation समय 15 मिनट से 4 मिनट हो गया।


उपाय 4: Sub-Agents के साथ समानांतर निष्पादन

भारी प्रसंस्करण को parallelize करने से कुल समय में भारी कमी आ सकती है।

समानांतर अनुवाद (वह तरीका जो मैं वास्तव में उपयोग करता हूँ)

// ❌ क्रमिक अनुवाद: 9 भाषाएँ × 30 सेकंड = 270 सेकंड (4.5 मिनट)
for (const lang of languages) {
  await translate(article, lang);
}

// ✅ Agent tool के साथ समानांतर delegation: समय = सबसे धीमी भाषा ≈ 30 सेकंड
// (इस साइट पर sub-agents को bulk में delegate करने से 8 मिनट → 1.5 मिनट हो गया)
Agent({
  prompt: `${article} को 9 भाषाओं में translate करो और हर file सेव करो: EN/DE/ES/FR/HI/ID/KO/PT/ZH`
})

Sub-agents अपने स्वतंत्र कॉन्टेक्स्ट में चलते हैं, इसलिए मुख्य कॉन्टेक्स्ट को प्रदूषित नहीं करते। यह भी गति सुधार में योगदान देता है।


उपाय 5: Prompt Caching से input तेज़ करें

जब एक ही system prompt बार-बार उपयोग की जाती है, prompt caching से input प्रसंस्करण लगभग 10 गुना तेज़ हो जाता है। इससे महसूस की गई गति पर भी असर पड़ता है।

// बस cache_control जोड़ें
system: [
  {
    type: "text",
    text: longSystemPrompt,
    cache_control: { type: "ephemeral" },
  },
],

जब 5 मिनट के भीतर एक ही system prompt पुनः उपयोग की जाती है, तो दूसरी कॉल से आगे पहली से ध्यान देने योग्य तेज़ होती है।


उपाय 6: CLAUDE.md से अनावश्यक खोज कम करें

CLAUDE.md में “उपयोग किए जाने वाले commands,” “डायरेक्टरी संरचना,” और “न पढ़ें” नियम लिखने से Claude Code बिना भटके सीधे काम करता है।

# प्रोजेक्ट नियम

## अक्सर उपयोग किए जाने वाले Commands (हर बार खोजने की ज़रूरत नहीं)
- Build: npm run build
- Test: npm run test
- Deploy: bash scripts/deploy.sh

## डायरेक्टरी संरचना
- src/components/: UI components
- src/pages/: routing
- src/content/blog/: blog articles (MDX)

## महत्वपूर्ण: ये डायरेक्टरी न पढ़ें
- node_modules/
- .wrangler/
- site/dist/

इससे Claude Code के “कहाँ देखूँ?” वाले turns की संख्या कम होती है, जिससे समग्र रूप से तेज़ी आती है।


वास्तविक गति सुधार के आँकड़े (इस साइट के)

संदर्भ के लिए, इस साइट (claudecode-lab.com) के वास्तविक परिणाम:

कामऑप्टिमाइज़ेशन से पहलेऑप्टिमाइज़ेशन के बादकमी
लेख generation (जापानी)8 मिनट2.5 मिनट69% तेज़
9-भाषा अनुवाद7 मिनट1.5 मिनट79% तेज़
Build + deploy13 मिनट11 मिनट15% तेज़
कुल (प्रति लेख)28 मिनट15 मिनट46% तेज़

/compact और सेशन प्रबंधन को कड़ाई से लागू करके, साइट अब प्रति लेख 10–12 मिनट पर स्थिर रूप से चलती है।


गति ऑप्टिमाइज़ेशन checklist

पहले क्या जाँचना है, उस क्रम में:

अभी करें (1 मिनट से कम):
□ कॉन्टेक्स्ट compress करने के लिए /compact चलाएँ
□ लंबे समय से चल रहे सेशन को restart करें
□ अनुवाद/formatting कामों को Haiku पर switch करें

आज करें (30 मिनट):
□ CLAUDE.md में "न पढ़ने वाले directories" जोड़ें
□ CLAUDE.md में अक्सर उपयोग किए जाने वाले commands जोड़ें
□ बड़े कामों को "सीमित दायरे वाले छोटे कामों" में बाँटने की आदत बनाएँ

इस हफ्ते करें:
□ दोहराए जाने वाले batch processes में cache_control जोड़ें
□ Parallelize किए जा सकने वाले कामों को Agent tool में delegate करने के patterns बनाएँ
□ मॉडल उपयोग के नियम तय करें और CLAUDE.md में जोड़ें

सारांश

Claude Code के धीमे होने के मूल कारण हैं “कॉन्टेक्स्ट का फूलना” और “फ़ाइल खोज की अक्षमता”। इन दोनों के प्रति जागरूक रहने से महसूस की गई गति में बड़ा फ़र्क पड़ता है।

सबसे प्रभावशाली सुधारों की मेरी प्राथमिकता सूची:

  1. /compact को आदत बनाएँ (तुरंत असर, कोई लागत नहीं)
  2. हर काम के लिए सही मॉडल उपयोग करें (अनुवाद को Haiku पर switch करना अकेले नाटकीय है)
  3. निर्देशों का दायरा स्पष्ट रूप से सीमित करें (बस “और कुछ पढ़ने की ज़रूरत नहीं” जोड़ें)
  4. Sub-agents को समानांतर delegation

सब कुछ एक साथ करना ज़रूरी नहीं है। बस आज के काम में /compact को शामिल करना ही ध्यान देने योग्य तेज़ महसूस होना चाहिए।

संबंधित लेख

#claude-code #performance #optimization #prompt-engineering #productivity

अपने Claude Code वर्कफ़्लो को अगले स्तर पर ले जाएँ

Claude Code में तुरंत कॉपी-पेस्ट करने योग्य 50 आज़माए हुए प्रॉम्प्ट टेम्पलेट।

मुफ़्त

मुफ़्त PDF: 5 मिनट में Claude Code चीटशीट

बस अपना ईमेल दर्ज करें और हम तुरंत A4 एक-पृष्ठ चीटशीट PDF भेज देंगे।

हम आपकी व्यक्तिगत जानकारी की सुरक्षा करते हैं और स्पैम नहीं भेजते।

Masa

लेखक के बारे में

Masa

Claude Code का गहराई से उपयोग करने वाले इंजीनियर। claudecode-lab.com चलाते हैं, जो 10 भाषाओं में 2,000 से अधिक पेजों वाला टेक मीडिया है।

संबंधित लेख

Claude Code API लागत पर पूरा नियंत्रण: $450 से $45/महीने तक की 90% बचत के 5 तरीके
Tips & Tricks

Claude Code API लागत पर पूरा नियंत्रण: $450 से $45/महीने तक की 90% बचत के 5 तरीके

Claude Code API की असली कीमतें और आंकड़े। प्रॉम्प्ट कैशिंग, मॉडल ऑप्टिमाइज़ेशन और बैच प्रोसेसिंग से $450 से $45 प्रति माह की 90% बचत कैसे हासिल की—पूरी जानकारी।

Claude Code के साथ 7 वास्तविक प्रोडक्शन इंसिडेंट: RCA और रोकथाम सहित पूर्ण रिकवरी
Tips & Tricks

Claude Code के साथ 7 वास्तविक प्रोडक्शन इंसिडेंट: RCA और रोकथाम सहित पूर्ण रिकवरी

Claude Code के साथ 7 वास्तविक प्रोडक्शन इंसिडेंट: API की लीक, DB डिलीट, बिलिंग विस्फोट और सेवा बाधा — मूल कारण विश्लेषण और रोकथाम रणनीतियों सहित।

Claude Code के 10 खतरनाक Prompt Patterns | क्या न करें और सुरक्षित विकल्प
Tips & Tricks

Claude Code के 10 खतरनाक Prompt Patterns | क्या न करें और सुरक्षित विकल्प

Claude Code को कभी न दें ये 10 खतरनाक prompt patterns। जानें कैसे अस्पष्ट निर्देश code नष्ट, DB बर्बाद, भारी बिल और key leak का कारण बनते हैं—सुरक्षित विकल्पों के साथ।