AI infrastructure-இன் மிகப்பெரிய செயல்திறன் இழப்புகளில் ஒன்று கணக்கீடு அல்ல, வெப்பம்
Data centers 2025-இல் மதிப்பிடப்பட்ட 485 terawatt-hours மின்சாரத்தை பயன்படுத்தின, மற்றும் source material படி அதன் சுமார் 30% computing-க்கு அல்லாமல் cooling-க்கு சென்றது. University of Illinois Urbana-Champaign-இல் உள்ள ஆராய்ச்சியாளர்களின் புதிய பணியை விவரிக்கும் இந்த தகவல், AI systems chip power densities-ஐ உயர்த்தி rack-scale deployments-ஐ அதிக வெப்பமான, அடர்த்தியான, மற்றும் இயக்குவதற்கு செலவானதாக மாற்றும் நிலையில் மேலும் புறக்கணிக்க முடியாத ஒன்றாகியுள்ளது.
3D-அச்சிடப்பட்ட pure copper plates-ஐ அடிப்படையாகக் கொண்ட ஒரு புதிய direct-to-chip cooling அணுகுமுறை இந்த பிரச்சினையை நேரடியாக தாக்க முயல்கிறது. அவர்களின் தொழில்நுட்பம் data center முழுவதும் cooling தொடர்பான மின்சார நுகர்வை சுமார் 30%-இலிருந்து வெறும் 1.1%-ஆகக் குறைக்க முடியும் என்று ஆராய்ச்சியாளர்கள் கூறுகின்றனர்.
இந்த எண்ணிக்கை நடைமுறையில் நிலைத்திருந்தால், AI infrastructure சுற்றியுள்ள மிக முக்கியமான hardware efficiency gains-களில் இதுவும் ஒன்றாக இருக்கும்.
Cooling இப்போது ஒரு strategic bottleneck ஆக இருப்பதற்கான காரணம்
Modern accelerators பெரும் அளவு power-ஐ பயன்படுத்துகின்றன, மேலும் electronics-ன் அடிப்படை physics படி அதே அளவுக்கு அருகிலான சக்தியை heat ஆக வெளியேற்றுகின்றன. source text ஒரு single NVIDIA GB200 chip 1,200 watts-இல் இயங்குவதாகக் குறிப்பிடுகிறது. இதை ஆயிரக்கணக்கான அல்லது இலட்சக்கணக்கான devices-க்கு விரிவுபடுத்தினால், thermal management சவால் facility economics-ன் மையமாகிறது.
அதனால்தான் cooling இனி பின்னணி engineering detail அல்ல. அது data center design, energy procurement, siting, uptime, மற்றும் அதிக அடர்த்தி compute clusters எவ்வளவு வேகமாக deploy செய்யப்படலாம் என்பதையெல்லாம் பாதிக்கிறது. AI demand வளரும்போது, cooling constraints கட்டிடமே என்ன செய்யலாம் என்பதை அதிகமாக நிர்ணயிக்கின்றன.
அதனால் order-of-magnitude gains வாக்குறுதி தரும் எந்த தொழில்நுட்பமும் தீவிர கவனத்திற்குரியது, குறிப்பாக அது முற்றிலும் புதிய facility class-ஐ தேவைப்படுத்தாமல் existing direct-to-chip cooling architectures-இல் இணைக்க முடிந்தால்.
புதிய system என்ன மாற்றுகிறது
இந்த அறிக்கை செய்யப்பட்ட முன்னேற்றம் mathematical design algorithm-ஐ additive manufacturing-உடன் இணைத்து, conventional cold plates-ஐ விட மேலான செயல்திறன் கொண்ட pure copper cooling plates-ஐ உருவாக்குகிறது. மிக முக்கியமான விவரம் material மட்டும் அல்ல, அந்த method உருவாக்கும் internal geometry ஆகும்.
source text படி, microscope imagery plate surface-இல் tiny fin structures-ஐ காட்டுகிறது. இவ்வாறான நுண்ணிய அம்சங்கள் effective surface area-ஐ அதிகரித்து, coolant மிகச்சூடான பகுதிகளில் எவ்வாறு நகர்கிறது என்பதைக் கட்டுப்படுத்துவதன் மூலம் heat transfer-ஐ கணிசமாக மேம்படுத்த முடியும்.
Traditional manufacturing, engineers cooling component-ன் உள்ளே உருவாக்கக்கூடிய shapes-க்கு வரம்புகளை விதைக்கிறது. Computational design மற்றும் 3D printing-ஐ இணைப்பதன் மூலம், ஆராய்ச்சியாளர்கள் thermal models சிறந்தது எனக் காட்டுவதை fabrication techniques உண்மையில் உருவாக்கக்கூடியதுடன் இணைக்க முயல்கிறார்கள்.
இதன் விளைவாக, பழைய thermal management assumptions-க்கு ஏற்ப மாற்றியமைக்கப்பட்ட ஒன்றல்லாமல், high-power chips-ன் உண்மைகளுக்காக வடிவமைக்கப்பட்ட ஒரு cold plate architecture கிடைக்கிறது.
கூறப்படும் savings ஏன் இவ்வளவு பெரியவை
முக்கிய எண்ணிக்கை heat-ஐ அகற்றும் energy cost-ஐ குறைப்பதிலிருந்தே வருகிறது, chips-ன் சொந்த power draw-ஐ குறைப்பதிலல்ல. ஒரு பொதுவான பெரிய data center-இல் cooling systems pumps, chillers, air handling, மற்றும் பிற support infrastructure மூலம் power-ஐ பயன்படுத்துகின்றன. chip level-இல் heat மிகச் செயல்திறனாக அகற்றப்பட்டால், thermal stack-ன் மற்ற பகுதிகளில் குறைவான வேலை தேவைப்படும்.
Direct-to-chip liquid cooling ஏற்கனவே ஈர்ப்பை கொண்டது, ஏனெனில் அது air cooling-ன் பல inefficiencies-ஐ தவிர்க்கிறது. Cold plate-ஐ மேம்படுத்துவது அந்த அணுகுமுறையை இன்னும் வலிமையாக ஆக்குகிறது. புதிய plates cooling-ன் electricity share-ஐ சுமார் 1.1%-க்கு கொண்டு வர முடியும் என்று ஆராய்ச்சியாளர்கள் கூறுகின்றனர்; இது தற்போதைய norms-ஐ விட நாடக ரீதியான முன்னேற்றம்.
Operators-க்கு, இது lower operating costs, better power usage effectiveness, மற்றும் energy-constrained environments-இல் compute deploy செய்ய கூடுதல் வாய்ப்பை அளிக்கும்.
இது ஆய்வகத்தைத் தாண்டி ஏன் முக்கியம்
AI infrastructure, energy policy, utility planning, மற்றும் public scrutiny-யுடன் அதிகமாக மோதுகிறது. Data center வளர்ச்சி local grids-ஐ அழுத்துகிறது, decarbonization முயற்சிகளை சிக்கலாக்குகிறது, மற்றும் நிறுவனங்களை புதிய power strategies தேட வைக்கிறது. எனவே cooling layer-இல் ஏற்படும் efficiency gains, ஒரு சாதாரண component improvement-ஐ விட பரந்த முக்கியத்துவம் கொண்டவை.
Cooling-ஐ மிக முக்கியமாக செயல்திறன் மிக்கதாக மாற்ற முடிந்தால், operators அதே power envelope-இல் இருந்து அதிக பயனுள்ள compute-ஐ எடுக்க முடியும். இது சில capacity bottlenecks-ஐ தாமதப்படுத்தி, electricity supply அல்லது grid interconnection கட்டுப்பாடுகளுள்ள பகுதிகளில் advanced facilities-ஐ அமைப்பதை எளிதாக்கலாம்.
இது AI-ன் விரிவாக்கம் குறிப்பாக power-hungry போலத் தோன்ற காரணமான non-compute energy penalty-ஐயும் குறைக்க முடியும். மூன்றில் ஒரு பங்கு power thermal overhead-க்கு செலவாகுவது ஒரு கவர்ச்சிகரமான இலக்கு. அதில் பெரும்பகுதியை குறைப்பது உரையாடலை மாற்றுகிறது.
எது இன்னும் தெளிவில்லாமல் உள்ளது
source material இந்தப் பணியை deployed commercial product-ஆக அல்ல, scientific advance-ஆகவே விளக்குகிறது. இதன் பொருள் scale-up, durability, manufacturability, cost, மற்றும் production data center systems-உடன் compatibility இன்னும் திறந்த கேள்விகளாக உள்ளன.
Hardware breakthroughs பெரும்பாலும் prototype அல்லது subsystem நிலையில் மிக வலிமையாகத் தெரிகின்றன; பின்னர் supply chains, maintenance, coolant chemistry, மற்றும் long-duration reliability ஆகியவற்றின் சிக்கல்கள் வருகிறபோது நிலை மாறுகிறது. Pure copper-இல் additive manufacturing-வும் ஒரு specialized capability ஆகும், மேலும் பெருமளவு deployment, volume-இல் economics வேலை செய்கிறதா என்பதைக் கொண்டே அமையும்.
இருப்பினும், திசை தெளிவானது. Cooling ஒரு first-order computing problem ஆகிவிட்டது, மேலும் geometry-aware, manufacturing-enabled thermal design ஒரு நம்பகமான முன்னேற்றப் பாதையாக உருவாகிறது.
பெரிய படம்
AI boom கவனத்தை models, chips, மற்றும் power contracts-க்கு நகர்த்தியுள்ளது. ஆனால் அந்த chips-ஐ உயிருடன் வைத்திருக்கும் physical systems, தொழில் எவ்வளவு compute-ஐ ஓடவிட முடியும் என்பதை இறுதியில் தீர்மானிக்கக்கூடும். Thermal management முன்பு infrastructure plumbing என்று கருதப்பட்டது. இப்போது அது frontier-ன் ஒரு பகுதி.
இந்த copper-plate அணுகுமுறை கவர்ச்சிகரமானது, ஏனெனில் இது ஒரு கடினமான வரம்பை நடைமுறை toolset-உடன் சமாளிக்கிறது: மேம்பட்ட design, மேம்பட்ட fabrication, மற்றும் மிக முக்கியமான இடத்தில் மேம்பட்ட heat transfer. இது compute-ஐ இலவசமாக மாற்றாது, அல்லது data center energy demand-ஐ ஒழிக்காது. ஆனால் இன்னும் மதிப்புள்ள ஒன்றை வாக்குறுதி அளிக்கிறது: அந்த ஆற்றலின் மிகக் குறைந்த பகுதியை heat management-இல் வீணாக்கும் வழியை.
அடிக்கடி, அதுவே hyperscalers, cloud operators, மற்றும் AI infrastructure builders தேடும் வகை innovation ஆகும்.
This article is based on reporting by New Atlas. Read the original article.
Originally published on newatlas.com



