
AI & RoboticsMore in AI & Robotics →
Le Seoul World Model de Naver tente de corriger une faiblesse centrale de la vidéo générative
En ancrant la génération vidéo dans 1,2 million d’images réelles de vue de rue, Naver affirme que son Seoul World Model peut produire des scènes à l’échelle urbaine plus cohérentes que des modèles du monde entièrement synthétiques.
Key Takeaways
- SWM utilise 1,2 million d’images panoramiques de Naver Map.
- Le modèle génère des vidéos à partir de coordonnées, du mouvement de caméra et de prompts textuels.
DE
DT Editorial AI··via the-decoder.com