जब टूलमेकर ब्लूप्रिंट को प्रकट करता है
कई महीनों से, Claude Code का उपयोग करने वाले डेवलपर्स ने परीक्षण और त्रुटि, ब्लॉग पोस्ट और सामुदायिक मंचों के माध्यम से सर्वोत्तम प्रथाओं को एक साथ रखा। फिर स्वयं टूल के निर्माता ने अपना मौन तोड़ा। Boris Cherny, जो Anthropic पर Claude Code का नेतृत्व करते हैं, ने अपने व्यक्तिगत विकास वर्कफ्लो को X पर एक धागे में साझा किया जो तुरंत इंजीनियरिंग समुदाय के पूरे भर में वायरल हो गया।
"यदि आप Claude Code की सर्वोत्तम प्रथाओं को सीधे इसके निर्माता से नहीं पढ़ रहे हैं, तो आप एक प्रोग्रामर के रूप में पिछड़े हुए हैं," प्रमुख डेवलपर voice Jeff Tang ने लिखा। Kyle McNease ने इसे Anthropic का "ChatGPT moment" कहा — वह inflection बिंदु जहाँ तकनीक प्रभावशाली होना बंद करती है और अपरिहार्य होने लगती है।
एक साथ पाँच एजेंट: फ्लीट कमांडर मॉडल
Cherny के दृष्टिकोण का केंद्र बिंदु समांतरवाद है। विकास कार्य को रैखिक रूप से काम करने के बजाय, Cherny पाँच Claude instances को एक साथ अलग-अलग terminal tabs में चलाते हैं, उन्हें उसी तरह प्रबंधित करते हैं जैसे एक कमांडर मैदान में इकाइयों को प्रबंधित करता है।
"मैं अपने terminal में 5 Claudes को parallel में चलाता हूँ," Cherny ने लिखा। "मैं अपने tabs को 1-5 नंबर देता हूँ, और जानने के लिए system notifications का उपयोग करता हूँ कि कब एक Claude को input की जरूरत है।" वह browser में अतिरिक्त सत्र भी चलाते हैं, web और स्थानीय machine contexts के बीच काम को transfer करने के लिए एक custom teleport command का उपयोग करते हुए।
एक agent एक test suite चलाता है जबकि दूसरा legacy code को refactor करता है, एक तीसरा documentation का मसौदा तैयार करता है, और दो और स्वतंत्र feature work से जूझते हैं। मानव की भूमिका code लिखने से एजेंट को निर्देशित करने और blockers को हल करने में बदल जाती है — एक fundamentally भिन्न cognitive mode जिसकी Cherny एक real-time strategy game खेलने के बजाय syntax टाइप करने से तुलना करते हैं।
सबसे धीमे मॉडल का मामला
Cherny के सबसे counterintuitive revelations में से एक उनकी model choice थी। inference speed के साथ obsessed एक industry में, वह exclusively Opus 4.5 का उपयोग करते हैं — Anthropic का largest, slowest model — सब कुछ के लिए।
"मैं सब कुछ के लिए thinking के साथ Opus 4.5 का उपयोग करता हूँ," उन्होंने लिखा। "यह सर्वोत्तम coding model है जिसका मैंने कभी उपयोग किया है, और भले ही यह Sonnet की तुलना में बड़ा और धीमा है, चूँकि आपको इसे कम steer करना पड़ता है और यह tool use में बेहतर है, यह लगभग हमेशा अंत में एक छोटे मॉडल का उपयोग करने से तेज़ होता है।"
तर्क सही है। AI-assisted development में latency bottleneck token generation speed नहीं है — यह human correction time है। एक तेज़ लेकिन कम सक्षम model कार्यों को quickly पूरा करता है लेकिन errors को ठीक करने के लिए frequent intervention की आवश्यकता होती है। एक धीमा लेकिन अधिक accurate model compute cost को front-load करता है जबकि correction cost को eliminate करता है, और जब पाँच instances parallel में चलते हैं, तो wall-clock advantage significantly compound होता है।
CLAUDE.md: हर गलती को एक नियम में बदलना
Standard LLMs के पास sessions में persistent memory नहीं है। Cherny की टीम इसे एक फ़ाइल CLAUDE.md के साथ संबोधित करती है जो project के git repository में checked है। "जब भी हम Claude को कुछ गलत तरीके से करते हुए देखते हैं तो हम इसे CLAUDE.md में जोड़ते हैं, ताकि Claude अगली बार इसे न करे," उन्होंने समझाया।
फ़ाइल हर session के context के लिए prepended एक growing rulebook के रूप में कार्य करती है। एक human reviewer एक pull request में एक गलती को spot करता है, Claude को tag करता है error को एक rule के रूप में document करने के लिए, और हर future session को लाभ मिलता है। समय के साथ, CLAUDE.md एक precision instrument बन जाता है जो हर codebase की specific conventions और pitfalls के लिए tuned होता है।
सत्यापन सच्चे गुणक के रूप में
Cherny का workflow agent को browser automation, bash command execution, और test suite runs के through अपने काम को verify करने की क्षमता देता है। "Claude claude.ai/code को हर single change को test करता है Claude Chrome extension का उपयोग करके," उन्होंने लिखा। "यह एक browser खोलता है, UI को test करता है, और iterate करता है जब तक code काम नहीं करता और UX अच्छा नहीं लगता।" वह estimate करते हैं कि यह verification loop output quality को verification के बिना generation की तुलना में 2 से 3x से improve करता है — एक multiplicative effect जो underlying model की capability की परवाह किए बिना लागू होता है।
यह लेख VentureBeat की reporting पर आधारित है। मूल लेख पढ़ें.
Originally published on venturebeat.com

