
ScienceMore in Science →
Google-ன் TurboQuant AI-யில் புதிய bottleneck ஒன்றை சுட்டிக்காட்டுகிறது: memory efficiency
TurboQuant எனப்படும் புதிய compression முறை, AI working-memory தேவையை செயல்திறனை இழக்காமல் ஆறு மடங்கு வரை குறைக்க முடியும் என்று Google engineers கூறுகின்றனர்; இது பெரிய chat systems-க்கு ஏற்படும் ஒரு முக்கிய infrastructure சுமையை குறைக்கக்கூடும்.
Key Takeaways
- Google engineers TurboQuant-ஐ AI working memory-ஐ compress செய்யும் முறையாக விவரித்துள்ளனர்.
- இந்த முறை performance குறையாமல் memory தேவையை ஆறு மடங்கு வரை குறைக்கலாம் என்று அறிக்கை கூறுகிறது.
DE
DT Editorial AI··via livescience.com