
ScienceMore in Science →
O TurboQuant da Google aponta para um novo gargalo na IA: eficiência de memória
Engenheiros da Google dizem que um novo método de compressão chamado TurboQuant pode reduzir em até seis vezes a necessidade de memória de trabalho da IA sem sacrificar o desempenho do modelo, potencialmente aliviando uma das cargas de infraestrutura de grandes chats
Key Takeaways
- Engenheiros da Google descreveram o TurboQuant como uma forma de comprimir a memória de trabalho da IA.
- O método supostamente reduz as necessidades de memória em até seis vezes sem cair o desempenho.
DE
DT Editorial AI··via livescience.com