वेब की स्मृति संस्थाओं तक स्टोरेज की तंगी पहुँच गई है

AI डेटा सेंटर बूम केवल चिप बाजारों और बिजली की मांग को ही नहीं बदल रहा। यह इंटरनेट को स्वयं सुरक्षित रखने वाली संस्थाओं पर भी एक शांत प्रकार का दबाव बना रहा है। 404 Media द्वारा उद्धृत अभिलेखपालों और गैर-लाभकारी संचालकों के अनुसार, उच्च-क्षमता वाली हार्ड ड्राइव और सॉलिड-स्टेट स्टोरेज की बढ़ती कीमतें और कमी डिजिटल अभिलेखों को बनाए रखना और उन्हें बढ़ाना कठिन बना रही हैं।

यह प्रभाव खास तौर पर उन संगठनों पर पड़ रहा है जिनका अस्तित्व बड़ी मात्रा में स्टोरेज अर्थशास्त्र पर निर्भर करता है। Internet Archive, Wikimedia, अकादमिक संस्थान, और शौकिया अभिलेखपाल सभी डेटा के विशाल भंडार को ingest, replicate, और सुरक्षित रखने के लिए ड्राइव की नियमित आपूर्ति पर निर्भर हैं। जैसे-जैसे AI infrastructure बढ़ रहा है, उनके अनुसार, ये मूलभूत घटक अधिक महंगे, अधिक कठिन से मिलने वाले, या दोनों बनते जा रहे हैं।

स्टोरेज बाजार की उछाल संरक्षण के लिए क्यों मायने रखती है

डिजिटल संरक्षण अमूर्त लगता है, लेकिन यह भौतिक हार्डवेयर पर टिका होता है। हर crawl, upload, backup, और mirrored collection अंततः किसी ऐसे उपकरण पर जाता है जिसे खरीदना, तैनात करना, और बदलना पड़ता है। जब इन उपकरणों की कीमत बढ़ती है, तो अभिलेखागार को सीधे क्षमता संबंधी बाधा का सामना करना पड़ता है।

रिपोर्ट एक स्पष्ट उदाहरण देती है: 2TB Samsung SSD, जिसकी कीमत पिछले पतझड़ में $159 थी, प्रकाशन के समय $575 में बिक रही थी। PC Part Picker के ट्रैकिंग डेटा के अनुसार, पिछले वर्ष के अक्टूबर के आसपास से consumer और enterprise storage दोनों में व्यापक वृद्धि देखी गई है, कुछ ड्राइव की कीमत दोगुनी हुई है या 150 प्रतिशत से अधिक बढ़ी है। कुछ मामलों में ड्राइव्स बस उपलब्ध ही नहीं हैं, और दुर्लभ मॉडलों के इर्द-गिर्द resale market भी बन गया है।

सबसे बड़े अभिलेखागार पहले से ही कमी के मुताबिक खुद को ढाल रहे हैं

Internet Archive और Wayback Machine के संस्थापक Brewster Kahle ने इस समस्या को समय और पैसे दोनों के लिहाज़ से बहुत वास्तविक बताया। Archive हर दिन 100 terabytes से अधिक नई सामग्री जुटाता है और पहले से ही 210 petabytes से अधिक अभिलेखित सामग्री रखता है, जिसे लगातार उन्नयन और रखरखाव की ज़रूरत होती है। Kahle ने कहा कि संगठन की पसंदीदा 28-30TB ड्राइव या तो उपलब्ध नहीं हैं या असामान्य रूप से महँगी हैं।

ऐसी माँग के पैमाने पर विकल्प चुनना कठिन हो जाता है। कोई अभिलेखागार अस्थायी कमी के साथ काम चला सकता है, लेकिन हर workaround की अपनी लागत होती है, चाहे वह दक्षता में हो, खरीद-योजना में, या हार्डवेयर मानकीकरण में। संरक्षण संस्थान के लिए, इसका मतलब धीमी वृद्धि, अधिक परिचालन जटिलता, या और सख्त बजट दबाव हो सकता है।

Wikimedia भी वही चेतावनी संकेत देख रही है

Wikipedia और Wikimedia Commons का समर्थन करने वाली Wikimedia Foundation ने भी प्रकाशन को बताया कि स्टोरेज कीमतों में बढ़ोतरी चिंता का विषय है। केवल Wikipedia के ही 65 million से अधिक लेख और उसके व्यापक प्रोजेक्ट्स के पीछे पर्याप्त media infrastructure होने के कारण, server और storage क्षमता आवश्यक संचालन जरूरतें हैं। Wikimedia का कहना है कि बढ़ोतरी न केवल memory और hard drives की सीधे खरीद को प्रभावित करती है, बल्कि server delivery के lead times और भविष्य के ऑर्डर की योजना बनाने की क्षमता को भी प्रभावित करती है।

यह इसलिए मायने रखता है क्योंकि गैर-लाभकारी संगठन supply shocks को उस तरह absorb नहीं कर सकते जैसे hyperscale operators कर सकते हैं। बड़े AI कंपनियाँ data center expansion के जरिए storage मांग को बढ़ा सकती हैं, लेकिन वे आमतौर पर सार्वजनिक-हित वाले अभिलेखागार की तुलना में बिल्कुल अलग capital flexibility के साथ काम करती हैं।

AI buildout की एक व्यापक लागत

यह कहानी AI boom के एक सूक्ष्म सांस्कृतिक परिणाम की ओर इशारा करती है। नई generative systems को शक्ति देने वाली वही infrastructure race, web के ऐतिहासिक रिकॉर्ड को सुरक्षित रखने की लागत भी बढ़ा सकती है। यह तनाव नज़रअंदाज़ करना कठिन है। जब technology industry लगातार बड़े models और services बनाने पर जोर दे रही है, तब डिजिटल संस्कृति के स्रोत-सामग्री को संरक्षित रखने वाले समूहों को ठहरे रहने के लिए भी अधिक खर्च करना पड़ रहा है।

यह सुझाव नहीं है कि हर storage market movement की वजह सिर्फ AI है। लेकिन archive sector स्पष्ट रूप से एक ऐसे supply environment के दुष्प्रभाव महसूस कर रहा है जो aggressive infrastructure demand से आकार ले रहा है। जब preservation budgets पर दबाव पड़ता है, तो जोखिम अमूर्त नहीं रहता। कुछ data विलंबित हो सकते हैं, प्राथमिकता से बाहर किए जा सकते हैं, या बड़े पैमाने पर सुरक्षित रखना कठिन हो सकता है।

इंटरनेट को हमेशा memory problem रही है। links टूटते हैं, platforms गायब हो जाते हैं, और formats पुराने पड़ जाते हैं। मौजूदा समय को उल्लेखनीय बनाने वाली बात यह है कि याद रखने का बाजार महँगा होता जा रहा है, जबकि संरक्षित करने लायक सामग्री की मात्रा बढ़ती जा रही है। अभिलेखागारों के लिए यह सिर्फ़ खरीद-सम्बंधी समस्या नहीं है। यह digital history के दीर्घकालिक संरक्षण के सामने एक संरचनात्मक चुनौती है।

यह लेख 404 Media की रिपोर्टिंग पर आधारित है। मूल लेख पढ़ें.

Originally published on 404media.co