
New
AI & RoboticsMore in AI & Robotics →
Nvidia का Nemotron 3 Nano Omni दिखाता है कि खुले मल्टीमोडल मॉडल अब कैसे बनाए जाते हैं
Nvidia ने पाठ, छवि, वीडियो और ऑडियो प्रोसेसिंग के लिए एक खुला मल्टीमोडल मॉडल जारी किया है, साथ ही ऐसे विवरण भी दिए हैं जो दिखाते हैं कि अब फ्रंटियर AI प्रशिक्षण में प्रतिद्वंद्वी मॉडलों से आई भारी मात्रा में सिंथेटिक डेटा कितना असर डालता है
Key Takeaways
- Nvidia ने टेक्स्ट, छवि, वीडियो और ऑडियो के लिए एक खुला commercial multimodal model जारी किया
- training pipeline ने लगभग 717 billion tokens को सात stages में प्रोसेस किया
DE
DT Editorial AI··via the-decoder.com