
AI & RoboticsMore in AI & Robotics →
NaverのSeoul World Modelは、生成動画の中核的な弱点を修正しようとしている
1.2百万枚の実在するストリートビュー画像を基盤に動画生成を行うことで、NaverはSeoul World Modelが完全合成の世界モデルよりも一貫した都市規模のシーンを生成できると説明している。
Key Takeaways
- SWMはNaver Mapの120万枚のパノラマ画像を使っている。
- このモデルは座標、カメラの動き、テキストプロンプトから動画を生成する。
DE
DT Editorial AI··via the-decoder.com