
ScienceMore in Science →
Googles TurboQuant weist auf einen neuen Engpass in der KI hin: Speichereffizienz
Google-Ingenieure sagen, dass ein neues Komprimierungsverfahren namens TurboQuant den Bedarf an Arbeitsgedächtnis für KI um bis zu das Sechsfache senken kann, ohne die Modellleistung zu beeinträchtigen, und damit möglicherweise eine der Infrastrukturbelastungen großer Chat-Systeme mindert
Key Takeaways
- Google-Ingenieure beschrieben TurboQuant als Methode, das Arbeitsgedächtnis von KI zu komprimieren.
- Das Verfahren soll den Speicherbedarf ohne Leistungseinbußen um bis zu das Sechsfache senken.
DE
DT Editorial AI··via livescience.com