
AI & RoboticsMore in AI & Robotics →
El modelo del mundo de Seúl de Naver intenta corregir una debilidad central del video generativo
Al basar la generación de video en 1,2 millones de imágenes reales de street view, Naver afirma que su Seoul World Model puede producir escenas urbanas más coherentes que los modelos del mundo totalmente sintéticos.
Key Takeaways
- SWM usa 1,2 millones de imágenes panorámicas de Naver Map.
- El modelo genera video a partir de coordenadas, movimiento de cámara y prompts de texto.
DE
DT Editorial AI··via the-decoder.com