एक प्रमुख AI कार्यकारी ने मंदी वाले तर्क का विरोध किया

मुस्तफ़ा सुलेमान का कहना है कि कृत्रिम बुद्धिमत्ता अपनी वृद्धि की राह के अंत के करीब नहीं है।

MIT Technology Review

में प्रकाशित एक नए निबंध में, Microsoft के AI प्रमुख कहते हैं कि यह बार-बार की भविष्यवाणियाँ कि AI विकास जल्द ही किसी सीमा से टकरा जाएगा, उस कंप्यूट विस्तार के पैमाने और संरचना को गलत समझती हैं जो अभी इस क्षेत्र को आगे बढ़ा रहा है। उनका केंद्रीय दावा सरल है: फ्रंटियर AI के पीछे का कंप्यूट विस्फोट इस युग की परिभाषित करने वाली तकनीकी कहानी बना हुआ है, और इसके मूल चालकों में अभी भी और बढ़ने की गुंजाइश है।

यह निबंध स्पष्ट रूप से एक तर्क है, न कि कोई तटस्थ उद्योग रिपोर्ट, लेकिन यह इसलिए उल्लेखनीय है क्योंकि यह AI इन्फ्रास्ट्रक्चर में सबसे सीधे निवेश करने वाली कंपनियों में से एक के वरिष्ठ व्यक्ति से आता है। सुलेमान का रुख यह है कि संशयवादी लगातार किसी एक बाधा, जैसे धीमी होती मूर की लॉ, सीमित डेटा या ऊर्जा सीमाएँ, को खोज रहे हैं, जबकि यह नहीं देख रहे कि कई तकनीकी प्रगति एक साथ कैसे मिल रही हैं।

कंप्यूट दावे का पैमाना

सुलेमान कहते हैं कि फ्रंटियर AI मॉडलों में उपयोग की जाने वाली प्रशिक्षण गणना शुरुआती प्रणालियों से लेकर आज के सबसे बड़े मॉडलों तक लगभग एक ट्रिलियन गुना बढ़ गई है। वे 2010 में अपने काम के शुरुआती वर्षों में लगभग 10^14 फ्लोटिंग-पॉइंट ऑपरेशनों से लेकर आज की फ्रंटियर प्रणालियों के लिए 10^26 FLOPS से अधिक तक के परिवर्तन का वर्णन करते हैं। चाहे इस तुलना के हर निहितार्थ को स्वीकार किया जाए या नहीं, उनका बिंदु स्पष्ट है: AI की प्रगति को प्रशिक्षण पर लगाए गए कंप्यूट के ऐतिहासिक उछाल ने संचालित किया है।

यह रूपरेखा महत्वपूर्ण है क्योंकि यह चर्चा को बुद्धिमत्ता की अमूर्त धारणाओं से हटाकर औद्योगिक क्षमता पर वापस लाती है। इस दृष्टि से, AI प्रगति मुख्य रूप से अलग-अलग एल्गोरिदमिक सफलताओं की कहानी नहीं है। यह तेजी से विशाल होते सिस्टमों की कहानी है, जो अधिक प्रोसेसरों को अधिक व्यस्त रख सकते हैं, अधिक डेटा को उनके माध्यम से अधिक कुशलता से और लंबे समय तक प्रवाहित कर सकते हैं।

सुलेमान के तर्क के तीन तकनीकी स्तंभ

निबंध तीन ऐसे सुधारों की पहचान करता है जो अब उनके अनुसार साथ मिलकर काम कर रहे हैं। पहला है कच्चे चिप प्रदर्शन में तेजी। वे Nvidia हार्डवेयर के 2020 में 312 teraflops से आज 2,500 teraflops तक सुधार का उल्लेख करते हैं, जो छह वर्षों में आठ गुना वृद्धि है। वे Microsoft के Maia 200 चिप का भी हवाला देते हैं, जिसे जनवरी में लॉन्च किया गया था, और जिसके बारे में वे कहते हैं कि वह कंपनी के बेड़े के किसी भी अन्य हार्डवेयर की तुलना में 30% बेहतर performance per dollar देता है।

दूसरा है मेमोरी बैंडविड्थ। सुलेमान हाई बैंडविड्थ मेमोरी, यानी HBM, को रेखांकित करते हैं और कहते हैं कि नवीनतम पीढ़ी HBM3 अपने पूर्ववर्ती की बैंडविड्थ को तीन गुना कर देती है। व्यावहारिक रूप से, उनका तर्क यह है कि प्रशिक्षण प्रणालियाँ केवल गणना करने में ही बेहतर नहीं हो रही हैं, बल्कि प्रोसेसरों को इतनी तेजी से डेटा देने में भी बेहतर हो रही हैं कि महंगे एक्सीलरेटर डेटा की प्रतीक्षा करते हुए निष्क्रिय न रहें।

तीसरा है बड़े पैमाने की इंटरकनेक्शन। NVLink और InfiniBand जैसी तकनीकें, वे लिखते हैं, अब सैकड़ों हजारों GPUs को वेयरहाउस-स्केल सुपरकंप्यूटरों में जोड़ती हैं जो एक ही सिस्टम की तरह काम करते हैं। यह निबंध की थीसिस का एक अहम हिस्सा है। कहानी सिर्फ “बेहतर चिप्स” की नहीं है। यह ऐसे गणना-फैब्रिक्स के लगातार बड़े होते जाने की भी कहानी है, जो बर्बाद समय कम करते हैं और विशाल संख्या में प्रोसेसरों को एक साथ समन्वित करते हैं।

यह निबंध, भले ही एक राय-आधारित लेख है, फिर भी क्यों महत्वपूर्ण है

सुलेमान का तर्क एक सक्रिय बहस के बीच आता है। AI आलोचकों और कुछ शोधकर्ताओं ने सवाल उठाया है कि क्या मौजूदा स्केलिंग प्रवृत्तियाँ आर्थिक या भौतिक रूप से जारी रह सकती हैं। चिंताएँ आम तौर पर बिजली की मांग, पूंजी-गहनता, डेटा की कमी, और मॉडल को केवल बड़ा करते जाने से मिलने वाले घटते लाभों पर केंद्रित रहती हैं। सुलेमान इन चिंताओं को अलग-अलग खारिज करने की बजाय यह तर्क देते हैं कि वे अभी भी चिप सुधार, मेमोरी प्रगति और सिस्टम एकीकरण की संयुक्त शक्ति से अधिक भारी नहीं हैं।

यह रुख महत्वपूर्ण है क्योंकि अभी बड़े इन्फ्रास्ट्रक्चर नियोजन निर्णय लिए जा रहे हैं। अगर क्षेत्र मानता है कि कंप्यूट वक्र अभी भी तीव्र है, तो हाइपरस्केलर, चिप डिज़ाइनर और सरकारें असाधारण पैमाने पर निवेश जारी रखने की अधिक संभावना रखती हैं। अगर उन्हें लगता है कि एक कठोर दीवार करीब है, तो पूंजी आवंटन बदल जाता है। इसलिए यह निबंध केवल वर्णनात्मक नहीं है। यह इस प्रतिस्पर्धा का हिस्सा है कि AI कंपनियों को किस तरह का भविष्य बनाना चाहिए।

यह इस बात को भी दर्शाता है कि AI उद्योग प्रगति को increasingly systems terms में कैसे प्रस्तुत कर रहा है। प्रति चिप प्रदर्शन महत्वपूर्ण है, लेकिन बैंडविड्थ, नेटवर्किंग और सॉफ़्टवेयर समन्वय भी उतने ही महत्वपूर्ण हैं। व्यावहारिक परिणाम यह है कि AI नेतृत्व अब आपूर्ति श्रृंखलाओं, डेटा-सेंटर डिज़ाइन, और हार्डवेयर को एक सुसंगत प्रशिक्षण अवसंरचना में एकीकृत करने की क्षमता से अलग नहीं रह गया है।

मामले की ताकत और सीमाएँ

सुलेमान के तर्क की ताकत यह है कि यह किसी एक जादुई सफलता पर निर्भर नहीं करता। यह स्टैक की कई परतों में संचयी इंजीनियरिंग लाभों पर जोर देता है। बड़ी तकनीकी छलाँगें अक्सर इसी तरह अपेक्षा से अधिक समय तक गति बनाए रखती हैं। जब कई पड़ोसी परतें एक साथ सुधरती हैं, तो किसी एक क्षेत्र की रुकावट आंशिक रूप से संतुलित हो सकती है।

सीमा यह है कि एक राय-आधारित निबंध इस बात का प्रमाण नहीं है कि घातीय सुधार अनिश्चितकाल तक जारी रहेगा। लेख कहता है कि जब पूरे तकनीकी चित्र पर विचार किया जाता है तो यह प्रवृत्ति “काफी अनुमानित” लगती है, लेकिन दीर्घकालिक रास्ते अभी भी अर्थव्यवस्था, ऊर्जा उपलब्धता, आपूर्ति सीमाओं, और ग्राहकों को अंततः बड़े सिस्टमों से मिलने वाले मूल्य पर निर्भर रहते हैं। सुलेमान सतत स्केलिंग के पक्ष में एक जोरदार मामला रख रहे हैं, बहस को बंद नहीं कर रहे।

उद्योग के विश्वास का एक उपयोगी संकेत

फिर भी, यह निबंध एक उपयोगी संकेत है। यह दिखाता है कि क्षेत्र के प्रमुख कार्यकारी सार्वजनिक रूप से संयम के पक्ष में नहीं, बल्कि फ्रंटियर AI के पीछे के इन्फ्रास्ट्रक्चर निर्माण में निरंतर विश्वास के पक्ष में दलील दे रहे हैं। यह विश्वास रहस्यमय भाषा में नहीं रखा गया है। यह teraflops, बैंडविड्थ और इंटरकनेक्ट्स में निहित है। केवल यही वर्तमान उद्योग चरण के बारे में कुछ महत्वपूर्ण बताता है।

चैटबॉट्स और एजेंट्स के प्रति सार्वजनिक आकर्षण के बावजूद, AI का गुरुत्वाकर्षण केंद्र अभी भी कंप्यूट ही है। सुलेमान का निबंध याद दिलाता है कि रणनीतिक लड़ाई अभी भी हार्डवेयर और सिस्टम स्टैक की गहराई में लड़ी जा रही है। अगर वे सही हैं, तो उद्योग अभी एक बहुत बड़े विस्तार की शुरुआत में है। अगर वे गलत हैं, तो अगले कुछ साल इसकी सीमाएँ उजागर करेंगे। किसी भी स्थिति में, यह लेख उन कंपनियों की मानसिकता को पकड़ता है जो AI युग का निर्माण कर रही हैं: वे नहीं मानतीं कि दीवार अभी आ गई है।

यह लेख MIT Technology Review की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें