வலைக்கான நினைவக நிறுவனங்களுக்குத் storage நெருக்கடி எட்டியுள்ளது
AI data center பெருக்கம் chip சந்தைகளையும் மின்சார தேவையையும் மட்டும் மாற்றவில்லை. இணையத்தை itself பாதுகாக்கும் நிறுவனங்கள்மீதும் அது அமைதியான அழுத்தத்தை உருவாக்குகிறது. 404 Media மேற்கோளிட்ட archivists மற்றும் nonprofit operators கூறுவதன்படி, அதிக கொள்ளளவு hard drives மற்றும் solid-state storage பற்றாக்குறை மற்றும் விலை உயர்வு digital archives-ஐ பராமரிப்பதையும் விரிவாக்குவதையும் கடினமாக்குகிறது.
இந்த தாக்கம் குறிப்பாக bulk storage economics-ஐ சார்ந்து இயங்கும் அமைப்புகளில் கடுமையாக உள்ளது. Internet Archive, Wikimedia, கல்வியாளர்கள், மற்றும் hobby archivists ஆகிய அனைவரும் பெருமளவு தரவை ingest, replicate, பாதுகாக்க drive-களின் நிலையான வழங்கலையே சார்ந்துள்ளனர். AI infrastructure விரிவடையும் நிலையில், அந்த அடிப்படை கூறுகள் அதிக விலை, குறைந்த கிடைப்புத்தன்மை, அல்லது இரண்டுமே ஆகிவருகின்றன என்று அவர்கள் கூறுகின்றனர்.
Storage market spike ஏன் preservation-க்கு முக்கியம்
Digital preservation கேட்கும்போது அப்ஸ்டிராக்ட் போல தோன்றலாம்; ஆனால் அது உடல் hardware-ஐ அடிப்படையாகக் கொண்டது. ஒவ்வொரு crawl, upload, backup, மற்றும் mirrored collection-உம் இறுதியில் வாங்கப்பட்டு, deployed செய்யப்பட்டு, மாற்றப்பட வேண்டிய ஒரு device-ல் சேமிக்கப்படுகிறது. அந்த devices-ன் விலை உயர்ந்தால், archives-க்கு நேரடி capacity constraint உருவாகிறது.
அறிக்கை ஒரு தெளிவான உதாரணத்தை தருகிறது: கடந்த秋 காலத்தில் $159 இருந்த 2TB external Samsung SSD, வெளியீட்டு நேரத்தில் $575 ஆக இருந்தது. PC Part Picker tracking data-வின் படி, கடந்த ஆண்டின் அக்டோபர் காலத்திலிருந்து consumer மற்றும் enterprise storage இரண்டிலும் பரவலான விலை உயர்வுகள் பதிவாகியுள்ளன; சில drives-ன் விலை இரட்டிப்பாகியுள்ளது அல்லது 150 சதவீதத்திற்கும் அதிகமாக உயர்ந்துள்ளது. சில சந்தர்ப்பங்களில் drives முற்றிலும் sold out ஆகியுள்ளன, மேலும் அரிய models-ஐச் சுற்றி resale market உருவாகியுள்ளது.
பெரிய archives ஏற்கனவே பற்றாக்குறைக்கேற்ப தங்களை மாற்றிக் கொள்கின்றன
Internet Archive மற்றும் Wayback Machine நிறுவனர் Brewster Kahle, இந்தப் பிரச்சினை நேரத்திலும் பணத்திலும் உண்மையானது என்று கூறினார். Archive தினமும் 100 terabytes-க்கும் அதிகமான புதிய பொருட்களை சேகரிக்கிறது, மேலும் 210 petabytes-க்கும் அதிகமான archived material-ஐ ஏற்கனவே பராமரித்து வருகிறது; அதற்கு தொடர்ந்து upgrades மற்றும் maintenance தேவை. அமைப்பின் விருப்பமான 28-30TB drives கிடைக்கவில்லை அல்லது மிக உயர்ந்த விலையில் உள்ளன என்று Kahle கூறினார்.
அத்தகைய demand scale-இல் substitution செய்வது கடினம். ஒரு archive தற்காலிக பற்றாக்குறையை சமாளிக்கலாம், ஆனால் ஒவ்வொரு workaround-க்கும் efficiency, acquisition planning, அல்லது hardware standardization-இல் tradeoffs உண்டு. Preservation institution-க்கு அது மெதுவான வளர்ச்சி, அதிக operational complexity, அல்லது கடுமையான budget pressure-ஆக மாறலாம்.
Wikimedia-வும் அதே எச்சரிக்கை அறிகுறிகளைப் பார்க்கிறது
Wikipedia மற்றும் Wikimedia Commons-ஐ ஆதரிக்கும் Wikimedia Foundation, storage prices உயர்வது கவலையை ஏற்படுத்துகிறது என்று அந்த வெளியீட்டிடம் தெரிவித்தது. 65 million-க்கும் அதிகமான Wikipedia கட்டுரைகள் மட்டுமின்றி அதன் விரிவான projects-க்கு பின்னால் உள்ள முக்கிய media infrastructure காரணமாக, server மற்றும் storage capacity என்பது அத்தியாவசிய செயல்பாட்டு தேவைகளாகும். memory மற்றும் hard drives-ன் நேரடி கொள்முதலை மட்டுமல்லாமல் server delivery lead times-ஐயும் எதிர்கால ஆர்டர்களைத் திட்டமிடும் திறனையும் இந்த உயர்வுகள் பாதிக்கின்றன என்று Wikimedia கூறியது.
Nonprofits supply shocks-ஐ hyperscale operators போல absorb செய்ய முடியாததால் இது முக்கியம். பெரிய AI நிறுவனங்கள் data center expansion மூலம் storage demand-ஐ அதிகரிக்கலாம்; ஆனால் பொதுநல archives-களை விட அவை முற்றிலும் வேறுபட்ட capital flexibility-யோடு செயல்படுகின்றன.
AI buildout-ன் பரந்த செலவு
இந்தக் கதை AI boom-ன் ஒரு நுணுக்கமான பண்பாட்டு விளைவைக் காட்டுகிறது. புதிய generative systems-ஐ இயக்கும் அதே infrastructure race, web-ன் வரலாற்று பதிவை காப்பாற்றுவதற்கான செலவையும் உயர்த்தக்கூடும். இந்த tension-ஐ புறக்கணிக்க முடியாது. technology industry தொடர்ந்து பெரிய models மற்றும் services-ஐ உருவாக்க முயற்சிக்கும்போது, digital culture-ன் source material-ஐ பாதுகாக்கும் குழுக்கள் நிலைத்திருக்கவே அதிகம் செலவிட வேண்டியுள்ளது.
எல்லா storage market movement-களையும் AI மட்டுமே விளக்குகிறது என்பதில்லை. ஆனால் archive sector, தீவிர infrastructure demand ஆல் வடிவமைக்கப்படும் ஒரு supply environment-ன் பக்கவிளைவுகளைத் தெளிவாக உணர்கிறது. preservation budgets நெருக்கப்படும்போது, ஆபத்து அப்ஸ்டிராக்ட் அல்ல. சில data தாமதமாகலாம், குறைந்த முன்னுரிமை பெறலாம், அல்லது பெரிய அளவில் பாதுகாப்பது கடினமாகலாம்.
இணையத்திற்கு எப்போதுமே memory problem இருந்தது. links அழுகுகின்றன, platforms மறைகின்றன, formats சிதைகின்றன. தற்போதைய தருணத்தை குறிப்பிடத்தக்கதாக மாற்றுவது, நினைவில் வைத்திருக்க வேண்டியவற்றின் அளவு தொடர்ந்து பெருகிக்கொண்டிருக்க, அதையே நினைவில் வைத்திருக்க வேண்டிய சந்தை மேலும் விலையுயர்ந்ததாக மாறிவருவதுதான். archives-க்கு இது வெறும் procurement headache அல்ல. digital history-யின் நீண்டகால stewardship-க்கு ஒரு structural challenge.
இந்தக் கட்டுரை 404 Media-வின் செய்திப்பதிவை அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.
Originally published on 404media.co


