
AI & RoboticsMore in AI & Robotics →
Naver 的 Seoul World Model 试图修复生成式视频的一个核心弱点
通过将视频生成建立在 120 万张真实街景图像之上,Naver 表示其 Seoul World Model 相比完全合成的世界模型,能够生成更一致的城市级场景。
Key Takeaways
- SWM 使用了 120 万张 Naver Map 全景图像。
- 该模型根据坐标、摄像机运动和文本提示生成视频。
DE
DT Editorial AI··via the-decoder.com