
AI & RoboticsMore in AI & Robotics →
يحاول نموذج العالم في سيول من Naver إصلاح نقطة ضعف أساسية في الفيديو التوليدي
من خلال تأسيس توليد الفيديو على 1.2 مليون صورة حقيقية من صور الشوارع، تقول Naver إن نموذج العالم في سيول يمكنه إنتاج مشاهد حضرية أكثر اتساقًا من نماذج العالم الاصطناعية بالكامل.
Key Takeaways
- يستخدم SWM 1.2 مليون صورة بانورامية من Naver Map.
- يولد النموذج الفيديو من الإحداثيات وحركة الكاميرا والنصوص التوجيهية.
DE
DT Editorial AI··via the-decoder.com