
New
AI & RoboticsMore in AI & Robotics →
Nvidias Nemotron 3 Nano Omni zeigt, wie offene multimodale Modelle heute gebaut werden
Nvidia hat ein offenes multimodales Modell für Text-, Bild-, Video- und Audioverarbeitung veröffentlicht, zusammen mit Details, die zeigen, wie stark synthetische Daten aus Konkurrenzmodellen inzwischen das Training an der KI-Grenze prägen
Key Takeaways
- Nvidia hat ein offenes, kommerziell nutzbares multimodales Modell für Text, Bild, Video und Audio veröffentlicht
- Die Trainingspipeline verwendete in sieben Stufen rund 717 Milliarden Tokens
DE
DT Editorial AI··via the-decoder.com