
ScienceMore in Science →
TurboQuant de Google révèle un nouveau goulot d’étranglement de l’IA : l’efficacité mémoire
Des ingénieurs de Google affirment qu’une nouvelle méthode de compression appelée TurboQuant peut réduire jusqu’à six fois les besoins en mémoire de travail de l’IA sans sacrifier les performances du modèle, ce qui pourrait alléger l’un des fardeaux d’infrastructure des grands systèmes de chat
Key Takeaways
- Des ingénieurs de Google ont décrit TurboQuant comme un moyen de compresser la mémoire de travail de l’IA.
- La méthode réduirait les besoins en mémoire jusqu’à six fois sans baisse de performances.
DE
DT Editorial AI··via livescience.com