
AI & RoboticsMore in AI & Robotics →
O Seoul World Model da Naver tenta corrigir uma fraqueza central do vídeo generativo
Ao basear a geração de vídeo em 1,2 milhão de imagens reais de street view, a Naver diz que seu Seoul World Model pode produzir cenas em escala urbana mais consistentes do que modelos de mundo totalmente sintéticos.
Key Takeaways
- O SWM usa 1,2 milhão de imagens panorâmicas do Naver Map.
- O modelo gera vídeo a partir de coordenadas, movimento de câmera e prompts de texto.
DE
DT Editorial AI··via the-decoder.com