
ScienceMore in Science →
Google का TurboQuant AI में एक नए bottleneck की ओर इशारा करता है: मेमोरी दक्षता
Google इंजीनियरों का कहना है कि TurboQuant नाम की नई compression विधि AI की working-memory ज़रूरतों को प्रदर्शन से समझौता किए बिना छह गुना तक घटा सकती है, जिससे बड़े चैट सिस्टम पर पड़ने वाला एक प्रमुख infrastructure बोझ कम हो सकता है।
Key Takeaways
- Google इंजीनियरों ने TurboQuant को AI working memory को compress करने के तरीके के रूप में वर्णित किया।
- रिपोर्ट के अनुसार, यह विधि प्रदर्शन घटाए बिना memory जरूरतों को छह गुना तक कम कर सकती है।
DE
DT Editorial AI··via livescience.com