
New
AI & RoboticsMore in AI & Robotics →
Le Nemotron 3 Nano Omni de Nvidia montre comment les modèles multimodaux ouverts sont désormais construits
Nvidia a publié un modèle multimodal ouvert pour le traitement du texte, de l’image, de la vidéo et de l’audio, avec des détails montrant à quel point les données synthétiques issues de modèles concurrents façonnent désormais l’entraînement de l’IA de pointe
Key Takeaways
- Nvidia a publié un modèle multimodal ouvert et commercial pour le texte, l’image, la vidéo et l’audio
- Le pipeline d’entraînement a utilisé environ 717 milliards de tokens sur sept étapes
DE
DT Editorial AI··via the-decoder.com