AI infrastructure-এর সবচেয়ে বড় অদক্ষতাগুলোর একটি computation নয়, বরং heat

Data centers 2025 সালে আনুমানিক 485 terawatt-hours বিদ্যুৎ ব্যবহার করেছে, এবং source material অনুযায়ী তার প্রায় 30% computing-এর বদলে cooling-এ গেছে। University of Illinois Urbana-Champaign-এর গবেষকদের নতুন কাজ নিয়ে বর্ণিত এই overhead AI systems chip power densities বাড়িয়ে rack-scale deployments-কে আরও গরম, আরও ঘন, এবং চালাতে বেশি ব্যয়বহুল করে তোলায় উপেক্ষা করা কঠিন হয়ে উঠেছে।

3D-printed pure copper plates-কে কেন্দ্র করে তৈরি নতুন direct-to-chip cooling approach এই সমস্যাকে সরাসরি আঘাত করতে চায়। গবেষকেরা বলছেন, তাদের technology একটি data center জুড়ে cooling-related বিদ্যুৎ খরচ প্রায় 30% থেকে মাত্র 1.1%-এ নামিয়ে আনতে পারে।

এই সংখ্যা বাস্তবে টিকে গেলে, AI infrastructure-এর চারপাশে উঠে আসা সবচেয়ে তাৎপর্যপূর্ণ hardware efficiency gains-গুলোর একটি হবে এটি।

Cooling এখন strategic bottleneck কেন

Modern accelerators বিপুল পরিমাণ power ব্যবহার করে এবং electronics-এর মৌলিক physics অনুযায়ী প্রায় সেই পরিমাণই heat হিসেবে ছড়িয়ে দেয়। source text একটি single NVIDIA GB200 chip 1,200 watts-এ চলছে বলে ইঙ্গিত করে। এটি হাজার হাজার বা লক্ষাধিক device-এর ওপর প্রয়োগ করলে thermal management challenge facility economics-এর কেন্দ্রে চলে আসে।

এই কারণেই cooling আর background engineering detail নয়। এটি data center design, energy procurement, siting, uptime, এবং আরও ঘন compute clusters কত দ্রুত deploy করা যাবে, সবকিছুকেই প্রভাবিত করে। AI demand বাড়ার সঙ্গে সঙ্গে cooling constraints increasingly ঠিক করে দিচ্ছে কী কী নির্মাণ করা সম্ভব।

তাই order-of-magnitude gains-এর প্রতিশ্রুতি দেওয়া যেকোনো technology-ই গুরুত্বের সঙ্গে দেখার মতো, বিশেষ করে যদি তা সম্পূর্ণ নতুন facility class প্রয়োজন না করেই existing direct-to-chip cooling architectures-এ যুক্ত করা যায়।

নতুন system কী বদলায়

reported advance-টি mathematical design algorithm এবং additive manufacturing-কে একত্র করে এমন pure copper cooling plates তৈরি করে যা conventional cold plates-এর চেয়ে ভালো পারফর্ম করে। সবচেয়ে গুরুত্বপূর্ণ বিষয়টি শুধু material নয়, বরং internal geometry যা এই method তৈরি করতে পারে।

source text অনুযায়ী, microscope imagery plate surface-এ tiny fin structures দেখায়। এই ধরনের সূক্ষ্ম feature effective surface area বাড়িয়ে এবং coolant সবচেয়ে গরম zone-গুলোর ওপর কীভাবে প্রবাহিত হয় তা নিয়ন্ত্রণ করে heat transfer নাটকীয়ভাবে উন্নত করতে পারে।

Traditional manufacturing engineers-দের cooling component-এর ভিতরে কী ধরনের shape বানাতে পারবেন, তার ওপর সীমা আরোপ করে। Computational design এবং 3D printing একত্র করে গবেষকেরা thermal model যা সর্বোত্তম বলে দেখায় এবং fabrication technique যা বাস্তবে বানাতে পারে, তাদের মধ্যে gap কমানোর চেষ্টা করছেন।

ফলে এমন এক cold plate architecture পাওয়া যাচ্ছে যা পুরনো thermal management assumptions থেকে অভিযোজিত নয়, বরং high-power chips-এর বাস্তবতার জন্য তৈরি।

কেন claimed savings এত বড়

headline figure-টি heat সরানোর energy cost কমানো থেকে আসে, chips-এর নিজস্ব power draw কমানো থেকে নয়। একটি সাধারণ বড় data center-এ cooling systems pumps, chillers, air handling, এবং অন্যান্য support infrastructure-এর মাধ্যমে power খরচ করে। chip level-এ heat অনেক বেশি দক্ষতার সঙ্গে বের করা গেলে, পুরো thermal stack জুড়ে কম কাজ লাগবে।

Direct-to-chip liquid cooling ইতিমধ্যেই আকর্ষণীয়, কারণ এটি air cooling-এর অনেক inefficiency এড়ায়। cold plate উন্নত করলে সেই approach আরও শক্তিশালী হয়। গবেষকেরা বলছেন, নতুন plates cooling-এর electricity share প্রায় 1.1%-এ নামিয়ে আনতে পারে, যা বর্তমান norm-এর তুলনায় নাটকীয় উন্নতি।

Operators-এর জন্য এর অর্থ lower operating costs, better power usage effectiveness, এবং energy-constrained environment-এ compute deploy করার জন্য বাড়তি সুযোগ।

ল্যাবের বাইরে কেন এটি গুরুত্বপূর্ণ

AI infrastructure ক্রমশ energy policy, utility planning, এবং public scrutiny-এর সঙ্গে সংঘাতে জড়াচ্ছে। Data center growth local grids-এ চাপ বাড়াচ্ছে, decarbonization efforts জটিল করছে, এবং কোম্পানিগুলোকে নতুন power strategy খুঁজতে বাধ্য করছে। তাই cooling layer-এ efficiency gains সাধারণ component improvement-এর চেয়ে অনেক বড় তাৎপর্য রাখে।

Cooling যদি ব্যাপকভাবে আরও efficient করা যায়, operators একই power envelope থেকে বেশি useful compute বের করতে পারবেন। এটি কিছু capacity bottleneck দেরি করাতে পারে এবং electricity supply বা grid interconnection সীমিত অঞ্চলগুলোতে advanced facilities siting সহজ করতে পারে।

এটি AI expansion-কে বিশেষভাবে power hungry বলে মনে হওয়ার পেছনে থাকা non-compute energy penalty-ও কমাতে পারে। তিন ভাগের এক ভাগ power thermal overhead-এ ব্যয় হওয়া একটি আকর্ষণীয় লক্ষ্য। তার বড় অংশ কমিয়ে দেওয়া কথাবার্তা বদলে দেয়।

এখনও কী অনিশ্চিত

source material এই কাজকে deployed commercial product নয়, একটি scientific advance হিসেবে উপস্থাপন করছে। এর মানে scale-up, durability, manufacturability, cost, এবং production data center systems-এর সঙ্গে compatibility এখনও খোলা প্রশ্ন।

Hardware breakthroughs প্রায়শই prototype বা subsystem স্তরে সবচেয়ে শক্তিশালী দেখায়, কিন্তু supply chains, maintenance, coolant chemistry, এবং long-duration reliability-এর জটিলতা এলে চিত্র বদলে যায়। Pure copper-এ additive manufacturing-ও একটি specialized capability, এবং ব্যাপক deployment volume-এ economics কাজ করে কি না, তার ওপর নির্ভর করবে।

তবু দিকনির্দেশ স্পষ্ট। Cooling একটি first-order computing problem হয়ে উঠেছে, আর geometry-aware, manufacturing-enabled thermal design একটি বিশ্বাসযোগ্য পথ হিসেবে উঠছে।

বড় চিত্র

AI boom মনোযোগকে models, chips, এবং power contracts-এর দিকে সরিয়েছে। কিন্তু ওই chips-গুলিকে সচল রাখা physical systems শেষ পর্যন্ত শিল্প কত compute চালাতে পারবে তা নির্ধারণ করতে পারে। Thermal management আগে infrastructure plumbing হিসেবে দেখা হতো। এখন এটি frontier-এর অংশ।

এই copper-plate approach আকর্ষণীয়, কারণ এটি একটি কঠিন সীমাকে practical toolset দিয়ে মোকাবিলা করে: better design, better fabrication, এবং সবচেয়ে প্রয়োজনীয় জায়গায় better heat transfer। এটি compute-কে সস্তা বা data center energy demand-কে শূন্য করে না। কিন্তু আরও মূল্যবান কিছু প্রতিশ্রুতি দেয়: সেই শক্তির অনেক কম অংশ heat management-এ নষ্ট করার একটি উপায়।

নিকট ভবিষ্যতে, এটিই hyperscalers, cloud operators, এবং AI infrastructure builders-এর খোঁজার মতো innovation।

This article is based on reporting by New Atlas. Read the original article.

Originally published on newatlas.com