
New
AI & RoboticsMore in AI & Robotics →
A Nemotron 3 Nano Omni da Nvidia mostra como os modelos multimodais abertos são construídos hoje
A Nvidia lançou um modelo multimodal aberto para processamento de texto, imagem, vídeo e áudio, junto com detalhes que mostram como dados sintéticos de modelos rivais agora moldam o treinamento de IA de fronteira
Key Takeaways
- A Nvidia lançou um modelo multimodal aberto e comercial para texto, imagem, vídeo e áudio
- O pipeline de treinamento usou cerca de 717 bilhões de tokens em sete etapas
DE
DT Editorial AI··via the-decoder.com