Amazon తన cloud infrastructure లో ఒక networking breakthrough ఉందని చెబుతోంది
data-center networking లో తాము ఒక పెద్ద పురోగతిని సాధించామని, 2025 చివరి నుండి తమ facilities లో ఈ technology ని ఇప్పటికే deploy చేయడం ప్రారంభించామని Amazon చెబుతోంది. కంపెనీ ప్రకారం, ఈ కొత్త design data speeds ను పెంచుతూనే energy use ను తగ్గిస్తుంది; పెద్దదైన, వేగవంతమైన infrastructure నిర్మించేందుకు cloud operators పోటీపడుతున్న నేపథ్యంలో ఇది ముఖ్యమైన అంశం కావచ్చు.
ఈ system Amazon వివరించేదాని ప్రకారం ఒక “quasi-random” architecture పై ఆధారపడింది. పూర్తిగా conventional, అత్యంత structured network layouts పై ఆధారపడకుండా, ఇది ordered design ను మరింత random network graphs కు సంబంధించిన performance advantages తో కలుపుతుంది. పరిశోధకులు దశాబ్దాలుగా random networks ను అధ్యయనం చేస్తూ వచ్చారు, కానీ వాటిని scale లో నమ్మకంగా, ఆర్థికంగా పనిచేయించేలా చేయడమే సవాల్ అని Amazon అంటోంది.
Theory నుంచి production వరకు
కంపెనీ గత నెలలో ప్రచురించిన RNG: Flat Datacenter Networks at Scale అనే paper లో ఈ approach ను వివరించింది. RNG అంటే resilient network graphs. ఈ graphs పూర్తిగా structured కూడా కావు, పూర్తిగా random కూడా కావు; బదులుగా, traditional topologies తో వచ్చే bottlenecks ను తగ్గిస్తూ resilience ను నిలుపుకునేలా రూపొందించబడ్డాయని Amazon చెబుతోంది.
AWS network engineering vice president Matt Rehder ఈ design వాస్తవానికి network ను flatten చేస్తుందని చెప్పారు. ఇది ముఖ్యమైనది, ఎందుకంటే అనేక data-center systems ఇప్పటివరకు fat-tree structures పై ఆధారపడ్డాయి, అందులో traffic అనేక vertical layers గుండా వెళ్తుంది. ఆ arrangement ను flatten చేయడం chokepoints ను తగ్గించి, machines యొక్క పెద్ద clusters అంతటా data flow ను మరింత సమర్థవంతంగా చేస్తుంది.
Hardware భాగం: ShuffleBox
ఈ architecture ను భౌతిక ప్రపంచంలో ఆచరణాత్మకంగా మార్చడానికి ShuffleBox అనే కొత్త equipment ను కూడా తాము రూపొందించామని Amazon తెలిపింది. ఈ రకమైన networking కు అవసరమైన cabling ను ఈ device స్వయంచాలకంగా shuffle చేస్తుందని కంపెనీ చెబుతోంది. ఇది ముఖ్యమైన వివరము, ఎందుకంటే random లేదా semi-random network graphs కాగితంపై ఆకర్షణీయంగా కనిపించినప్పటికీ, వాటిని physical గా wire చేయడం చారిత్రాత్మకంగా పెద్ద స్థాయి deployment ను కష్టతరం చేసింది.
కొత్త graph design మరియు కొత్త cabling hardware కలయికే academic possibility నుండి production use కి తాము మారడానికి సహాయపడిందని Amazon వాదిస్తోంది. మూలం పేర్కొన్న ఒక బాహ్య expert ఈ real-world deployment ను “remarkable” అని అభివర్ణించారు, ఇది ఈ సమస్య వర్గం పరిశ్రమకు ఎంత కఠినమో సూచిస్తోంది.
ప్రధానంగా generative AI గురించి కాదు
Amazon framing లో అత్యంత ఆసక్తికరమైన విషయం, కంపెనీ ఏమి హైలైట్ చేయలేదన్నదే. ఇది generative AI training infrastructure కోసం నేరుగా చేసిన pitch కాదని కంపెనీ తెలిపింది. AI training workloads ఎక్కువగా coordinated గా, centrally orchestrated గా ఉంటాయని, అందువల్ల RNG కి సహజంగా సరిపోయే random graph patterns లాంటివి అవి కావని Rehder అన్నారు.
దానికి బదులుగా, Amazon ఈ design ను తన core data-center architecture ను రోజువారీ cloud demand కోసం మరింత efficient గా మార్చే మార్గంగా చూపుతోంది. ఆ తేడా ముఖ్యమైనది. AI infrastructure spending narratives లో ఆధిపత్యం చెలాయించినప్పటికీ, cloud platforms యొక్క economic value ఇంకా general-purpose computing, storage, మరియు networking efficiency పై భారీగా ఆధారపడి ఉంది.
Cloud market కి ఇది ఎందుకు ముఖ్యమో
Data-center operators పై performance ను పెంచడం, power consumption ను నియంత్రించడం, అలాగే expansion costs ను manageable గా ఉంచడం అన్నీ ఒకేసారి ఒత్తిడిగా ఉన్నాయి. తక్కువ energy వాడుతూ ఎక్కువ throughput ఇస్తున్న networking design, ముఖ్యంగా అది పెద్ద existing footprint లో rollout చేయగలిగితే, గణనీయమైన operational advantage ను అందించగలదు.
గత సంవత్సరం చివరి నుండి ఈ technology ని quietly deploy చేస్తున్నామని Amazon చెబుతోంది, అంటే public గా మాట్లాడే ముందు ఈ system ను తగినంత mature గా భావించిందని సూచిస్తుంది. ఫలితాలు స్థిరంగా ఉంటే, established fat-tree model దాటి network architecture గురించి hyperscale operators ఎలా ఆలోచిస్తారో ఈ approach ప్రభావితం చేయవచ్చు.
Infrastructure innovation దాచిపెట్టగలమా అనే పరీక్ష
Cloud competition ను తరచుగా chips, models, మరియు software services పరంగా చర్చిస్తారు, కానీ modern computing లో networking ఇంకా ప్రాథమిక constraints లో ఒకటి. Amazon ప్రకటన, infrastructure లో కొన్ని అతిపెద్ద strategic gains పాత systems problems ను కొత్త మార్గాల్లో పరిష్కరించడంవల్ల వస్తాయని గుర్తుచేస్తోంది.
ప్రస్తుతం కంపెనీ చేసిన claim నిర్దిష్టంగా ఉంది: ఒక resilient, quasi-random network design ను కొత్త hardware తో కలిపితే production లో scale చేయవచ్చు, అలాగే speed మరియు energy efficiency రెండింటినీ మెరుగుపరచవచ్చు. ప్రత్యర్థులు ఇలాంటి పనితో స్పందిస్తే, cloud infrastructure competition యొక్క తదుపరి దశలో networking మరింత స్పష్టమైన front గా మారవచ్చు.
ఈ వ్యాసం Wired నివేదికపై ఆధారపడింది. మూల వ్యాసాన్ని చదవండి.
Originally published on wired.com





