
ScienceMore in Science →
TurboQuant de Google apunta a un nuevo cuello de botella en la IA: la eficiencia de memoria
Ingenieros de Google afirman que un nuevo método de compresión llamado TurboQuant puede reducir hasta seis veces las necesidades de memoria de trabajo de la IA sin sacrificar el rendimiento del modelo, lo que podría aliviar una de las cargas de infraestructura de los grandes sistemas de chat
Key Takeaways
- Los ingenieros de Google describieron TurboQuant como una forma de comprimir la memoria de trabajo de la IA.
- El método supuestamente reduce las necesidades de memoria hasta seis veces sin bajar el rendimiento.
DE
DT Editorial AI··via livescience.com