
ScienceMore in Science →
Google चे TurboQuant AI मधील नवीन bottleneck सूचित करते: memory efficiency
TurboQuant नावाची नवी compression पद्धत AI working-memory गरजा performance न बिघडवता सहा पट कमी करू शकते, असे Google engineers म्हणतात; त्यामुळे मोठ्या chat systems वरील एक महत्त्वाचा infrastructure भार कमी होऊ शकतो.
Key Takeaways
- Google engineers यांनी TurboQuant ला AI working memory compress करण्याचा मार्ग म्हणून वर्णन केले आहे.
- रिपोर्टनुसार ही पद्धत performance न बिघडवता memory गरजा सहा पटपर्यंत कमी करू शकते.
DE
DT Editorial AI··via livescience.com