
New
AI & RoboticsMore in AI & Robotics →
Nvidia’s Nemotron 3 Nano Omni muestra cómo se construyen ahora los modelos multimodales abiertos
Nvidia ha lanzado un modelo multimodal abierto para procesar texto, imagen, video y audio, junto con detalles que muestran cómo los datos sintéticos procedentes de modelos rivales están dando forma al entrenamiento de la IA de frontera
Key Takeaways
- Nvidia lanzó un modelo multimodal abierto y comercial para texto, imagen, video y audio
- La canalización de entrenamiento usó alrededor de 717.000 millones de tokens en siete etapas
DE
DT Editorial AI··via the-decoder.com