AI infrastructureలోని అతిపెద్ద inefficienciesలో ఒకటి computation కాదు, heat
Data centers 2025లో అంచనా ప్రకారం 485 terawatt-hours విద్యుత్ వినియోగించాయి, మరియు source material ప్రకారం అందులో సుమారు 30% computing కాకుండా coolingకు వెళ్లింది. University of Illinois Urbana-Champaign పరిశోధకుల కొత్త పనిని వివరించే ఈ వివరాలు, AI systems chip power densitiesను పెంచుతూ rack-scale deploymentsను మరింత వేడి, మరింత దట్టమైన, మరియు నడపడానికి ఖరీదైనవిగా చేస్తుండటంతో విస్మరించడం కష్టమైపోయింది.
3D-printed pure copper plates చుట్టూ నిర్మించిన ఒక కొత్త direct-to-chip cooling approach ఈ సమస్యను నేరుగా ఎదుర్కొనాలని లక్ష్యంగా పెట్టుకుంది. తమ technology data center అంతటా cooling-related విద్యుత్ వినియోగాన్ని సుమారు 30% నుండి కేవలం 1.1%కి తగ్గించగలదని పరిశోధకులు చెబుతున్నారు.
ఆ సంఖ్య వాస్తవంలో నిలిస్తే, AI infrastructure చుట్టూ ఉద్భవిస్తున్న అత్యంత ప్రాధాన్యమైన hardware efficiency gainsలో ఇది ఒకటిగా నిలుస్తుంది.
Cooling ఇప్పుడు strategic bottleneck ఎందుకు
Modern accelerators విపరీతమైన powerను వినియోగిస్తాయి, మరియు electronics యొక్క ప్రాథమిక physics ప్రకారం దానికి సమీపంలోనే heatగా విసర్జిస్తాయి. source text ఒకే NVIDIA GB200 chip 1,200 watts వద్ద పనిచేస్తోందని సూచిస్తుంది. దీన్ని వేల లేదా లక్షల పరికరాలకు వర్తింపజేస్తే thermal management సవాలు facility economics కేంద్రంగా మారుతుంది.
అందుకే cooling ఇక background engineering detail కాదు. ఇది data center design, energy procurement, siting, uptime, మరియు మరింత దట్టమైన compute clustersను ఎంత వేగంగా deploy చేయవచ్చో అన్నదానిపై ప్రభావం చూపుతుంది. AI demand పెరుగుతున్నకొద్దీ, cooling constraints ఏది నిర్మించగలమో అన్నదాన్ని మరింతగా నిర్దేశిస్తున్నాయి.
కాబట్టి order-of-magnitude gains వాగ్దానం చేసే ఏ technology అయినా గంభీరమైన శ్రద్ధకు అర్హం, ముఖ్యంగా అది పూర్తిగా కొత్త facility class అవసరం లేకుండా existing direct-to-chip cooling architecturesలో అనుసంధానించగలిగితే.
కొత్త system ఏమి మార్చుతుంది
ఈ reported advance mathematical design algorithmను additive manufacturingతో కలిపి conventional cold platesను మించిన pure copper cooling platesను తయారు చేస్తుంది. అత్యంత ముఖ్యమైన విషయం material మాత్రమే కాదు, ఈ method సృష్టించగల internal geometry కూడా.
source text ప్రకారం, microscope imagery plate surfaceపై tiny fin structuresను చూపిస్తుంది. అలాంటి సూక్ష్మ లక్షణాలు effective surface areaను పెంచి, coolant అతి వేడిగా ఉన్న zones మీద ఎలా ప్రవహిస్తుందో నియంత్రించడం ద్వారా heat transferను గణనీయంగా మెరుగుపరచగలవు.
Traditional manufacturing engineers cooling component లోపల నిర్మించగల shapesపై పరిమితులు విధిస్తుంది. Computational design మరియు 3D printingను కలిపి, పరిశోధకులు thermal models చూపే ఉత్తమ రూపకల్పనకు fabrication techniques వాస్తవంగా తయారుచేయగల రూపకల్పన మధ్య అంతరాన్ని తగ్గించడానికి ప్రయత్నిస్తున్నారు.
ఫలితంగా, పాత thermal management assumptionsకు అనుగుణంగా మార్చినదిగా కాకుండా high-power chips వాస్తవాలకు అనుగుణంగా రూపుదిద్దుకున్న cold plate architecture లభిస్తుంది.
క్లెయిమ్ చేసిన savings ఎందుకు అంత పెద్దవి
headline figure heat తొలగించే energy costను తగ్గించడం ద్వారా వస్తుంది, chips స్వయంగా వినియోగించే power drawను తగ్గించడం ద్వారా కాదు. సాధారణ పెద్ద data centerలో cooling systems pumps, chillers, air handling, మరియు ఇతర support infrastructure ద్వారా powerను వినియోగిస్తాయి. chip levelలో heat మరింత సమర్థవంతంగా తొలగిస్తే, thermal stack మిగిలిన భాగంలో తక్కువ పని అవసరం అవుతుంది.
Direct-to-chip liquid cooling ఇప్పటికే ఆకర్షణీయంగా ఉంది, ఎందుకంటే అది air cooling inefficienciesలో అనేకాన్ని దాటవేస్తుంది. Cold plateను మెరుగుపరచడం ఆ approachను మరింత శక్తివంతం చేస్తుంది. కొత్త plates cooling electricity shareను సుమారు 1.1%కి తగ్గించగలవని పరిశోధకులు చెబుతున్నారు, ఇది ప్రస్తుత ప్రమాణాలపై తీవ్రమైన మెరుగుదల.
Operatorsకు, ఇది lower operating costs, better power usage effectiveness, మరియు energy-constrained environmentsలో compute deploy చేయడానికి మరింత స్థలాన్ని సూచిస్తుంది.
ల్యాబ్ను మించి ఇది ఎందుకు ముఖ్యం
AI infrastructure క్రమంగా energy policy, utility planning, మరియు public scrutinyతో ఢీకొంటోంది. Data center growth local gridsపై ఒత్తిడి పెడుతోంది, decarbonization effortsను క్లిష్టం చేస్తోంది, మరియు కంపెనీలను కొత్త power strategies వెతకాల్సిన పరిస్థితిలోకి నెడుతోంది. కాబట్టి cooling layer వద్ద efficiency gains సాధారణ component improvement కంటే విస్తృత ప్రాధాన్యం కలిగి ఉన్నాయి.
Coolingను విపరీతంగా మరింత సమర్థవంతంగా చేయగలిగితే, operators అదే power envelope నుంచే ఎక్కువ ఉపయోగకరమైన computeను పొందగలరు. ఇది కొన్ని capacity bottlenecksను ఆలస్యం చేయవచ్చు మరియు electricity supply లేదా grid interconnection పరిమితులున్న ప్రాంతాల్లో advanced facilitiesను siting చేయడం సులభం చేయవచ్చు.
ఇది AI expansionను ప్రత్యేకంగా power-hungryగా చూపించిన non-compute energy penaltyను కూడా తగ్గించవచ్చు. మూడింటిలో ఒక భాగం power thermal overheadకు కేటాయించడం ఆకర్షణీయమైన లక్ష్యం. దాని పెద్దభాగాన్ని తగ్గించడం చర్చను మార్చేస్తుంది.
ఇంకా ఏమి అనిశ్చితంగా ఉంది
source material ఈ పనిని deployed commercial productగా కాకుండా scientific advanceగా సూచిస్తోంది. అంటే scale-up, durability, manufacturability, cost, మరియు production data center systemsతో compatibility ఇంకా తెరవున్న ప్రశ్నలే.
Hardware breakthroughs సాధారణంగా prototype లేదా subsystem స్థాయిలో బలంగా కనిపిస్తాయి, కానీ supply chains, maintenance, coolant chemistry, మరియు long-duration reliability వంటి సంక్లిష్టతలు వస్తే పరిస్థితి మారుతుంది. Pure copperలో additive manufacturing కూడా ఒక specialized capability, మరియు విస్తృత deployment volume వద్ద economics పనిచేస్తుందా అన్నదానిపై ఆధారపడి ఉంటుంది.
అయినప్పటికీ, దిశ స్పష్టంగా ఉంది. Cooling ఒక first-order computing problemగా మారింది, మరియు geometry-aware, manufacturing-enabled thermal design ఒక నమ్మదగిన ముందుకుసాగే మార్గంగా వెలుగులోకి వస్తోంది.
పెద్ద చిత్రం
AI boom దృష్టిని models, chips, మరియు power contractsపై కేంద్రీకరించింది. కానీ ఆ chipsను బతికించుకునే physical systems చివరికి పరిశ్రమ ఎంత compute నడపగలదో నిర్ణయించవచ్చు. Thermal management ముందుగా infrastructure plumbingగా పరిగణించబడేది. ఇప్పుడు అది frontierలో భాగం.
ఈ copper-plate approach ఆకర్షణీయంగా ఉంది, ఎందుకంటే ఇది ఒక కఠినమైన పరిమితిని practical toolsetతో పరిష్కరిస్తుంది: మెరుగైన design, మెరుగైన fabrication, మరియు అత్యంత అవసరమైన చోట మెరుగైన heat transfer. ఇది computeను ఉచితంగా చేయదు, లేదా data center energy demandను తుడిచిపెట్టదు. కానీ మరింత విలువైనదాన్ని వాగ్దానం చేస్తుంది: ఆ శక్తిలో చాలా తక్కువ భాగాన్ని heat managementలో వృథా చేసే మార్గం.
సమీప భవిష్యత్తులో, ఇదే hyperscalers, cloud operators, మరియు AI infrastructure builders వెతుకుతున్న innovation రకం.
This article is based on reporting by New Atlas. Read the original article.
Originally published on newatlas.com



