Dünya Modellerinden Robot Kontrolüne

NVIDIA, dünya vakfı modelleri artan ailesine yeni bir ekleme olan Cosmos Policy'yi açıklamıştır. Bu model, çevre anlayışı ile fiziksel robot kontrolü arasındaki boşluğu kapatıyor. Model, NVIDIA'nın mevcut dünya vakfı modeli olan Cosmos Predict-2'nin üzerine inşa ediliyor. Cosmos Predict-2, fiziksel ortamların zamanla nasıl değişeceğine dair tahminler üretiyor. Cosmos Policy bu tahminleri alıyor ve robotların karmaşık manipülasyon görevlerini gerçekleştirmek için kullanabileceği işletme yapılabilir kontrol sinyallerine dönüştürüyor.

Duyuru, NVIDIA'nın robotika AI'sına yaklaşımında önemli bir gelişimi temsil ediyor. Cosmos Policy, robotları kapsamlı gösterimler veya ödül mühendisliği yoluyla belirli görevleri gerçekleştirmeye eğitmek yerine, fiziksel dinamiklerin genelleştirilmiş bir anlayışından yararlanarak daha esnek ve uyarlanabilir robot davranışını sağlıyor. Prensip olarak, Cosmos Policy ile donatılmış bir robot, nesnelerin birbirleriyle ve robotun kendi gövdesiyle nasıl etkileşim kurduğu hakkında temel bir anlayışla yeni manipülasyon görevlerine yaklaşabilmelidir.

Cosmos Policy Nasıl Çalışır

Özünde, Cosmos Policy, Cosmos Predict-2 dünya vakfı modeline uygulanan bir post-training katmanıdır. Cosmos Predict-2, gerçek dünyada fizik etkileşimleri gösteren büyük miktarda video verisi üzerinde eğitilir ve belirli bir sahnede sonra ne olacağını tahmin etmeyi öğrenir. Örneğin, üzerinde nesneler bulunan bir masanın görüntüsü verildiğinde, model bu nesnelerin itildikleri, kaldırıldıkları veya düştükleri takdirde nasıl hareket edeceğini tahmin edebilir.

Cosmos Policy, istenen sonucu elde etmek için robotun hangi eylemleri alması gerektiğini belirleyen bir kontrol politikası ekleyerek bu tahmin yeteneği üzerine inşa edilir. Sistem aşağıdaki süreç aracılığıyla çalışır:

  • Sahne anlayışı: Robot, çevresinin mevcut durumunu yakalamak için kameraları ve sensörleri kullanır ve Cosmos Predict-2, sahnenin fizik dinamiklerinin iç bir temsilini oluşturur.
  • Hedef spesifikasyonu: Operatör veya daha yüksek seviye bir planlama sistemi, robotun nesneleri almak, belirli bir konuma yerleştirmek veya bileşenleri birleştirmek gibi ne yapması gerektiğini belirtir.
  • Eylem üretimi: Cosmos Policy, hedefe ulaşmak için robotun kollarını ve tutuşlarını hareket ettirecek bir motor komutları dizisi üretmek için dünya modelinin fizik anlayışını kullanır.
  • Gerçek zamanlı uyarlama: Robot görevi yürütürken, sistem yeni sensör verilerine dayalı olarak tahminlerini sürekli olarak günceller ve ortam beklenmedik şekilde değişirse eylemlerini ayarlamaya izin verir.

Bu yaklaşım, mühendislerin her hareketi manuel olarak belirttikleri geleneksel robot programlamasından veya robotun tamamen deneme-yanılma yoluyla öğrenmesi gereken saf takviyeli öğrenmeden temelde farklıdır. Fizik dinamikleri hakkında önceden eğitilmiş bir anlayışla başlayarak, Cosmos Policy robotlara yeni görevlerde önemli bir avantaj sağlıyor.

Neden Dünya Vakfı Modelleri Robotiğe Önemlidir

Dünya vakfı modellerinin kavramı, robotika ve AI araştırması topluluklarında birkaç yıldır ilgi kazanıyor, ancak NVIDIA'nın Cosmos ailesi fikrin en ticari olarak iddialı uygulamalarından birini temsil ediyor. Temel fikir, fiziksel dünyada çalışan robotların, desen tanıma veya dil anlayışından daha fazlasına ihtiyaç duymasıdır. Bir insanın bir masanın kenarına konulan bir bardağın düşeceğini tahmin etmesine veya ağır bir nesnenin hafif bir nesneden daha fazla kuvvetle kaldırılması gerektiğini anlamasına izin veren fiziğin sezgisel bir anlayışına ihtiyaç duyarlar.

Robot öğreniminin geleneksel yaklaşımları bununla mücadele etmiştir. Takviye öğrenmesi, belirli görevler için etkileyici sonuçlar üretebilir, ancak bilgi genellikle yeni durumlara iyi aktarılmaz. Taklit öğrenmesi, her yeni görev için kapsamlı gösteri verileri gerektirir. Manuel programlama, sık sık değişen ortamlar için çok katı.

Dünya vakfı modelleri, bu sınırlamalar aracılığıyla potansiyel bir yol sunuyor. Büyük miktarda gerçek dünya video verisi üzerinde bir model eğiterek, ortaya çıkan sistem, birçok farklı görev ve ortam arasında uygulanabilen fizik dinamikleri hakkında genel bir anlayış geliştirir. Cosmos Policy, NVIDIA'nın bu genel anlayışı pratik robot kontrolüne dönüştürme girişimidir.

NVIDIA'nın Robotik Ekosistemi ile Entegrasyon

Cosmos Policy yalıtımlı bir ortamda mevcut değildir. Simülasyon için Isaac Sim, robot operating system entegrasyonu için Isaac ROS ve edge computing için Jetson platformu dahil olmak üzere NVIDIA'nın daha geniş robotik yazılım yığını ile entegre olmak için tasarlanmıştır. Bu ekosistem yaklaşımı NVIDIA'nın stratejisinin önemli bir parçasıdır, çünkü bir kontrol politikası, robotların fiilen taşıdığı donanımlarda verimli bir şekilde çalışabilirse ve robot filolarını yöneten yazılım sistemleriyle iletişim kurabilirse yararlı olur.

NVIDIA, Cosmos Policy'nin hem simüle edilmiş hem de gerçek dünyada manipülasyon görevlerinde doğrulanmış olduğunu söylüyor. Buna, toplama ve yerleştirme operasyonları, robot kolları arasındaki nesne değişimi ve bileşenlerin hassas hizalanmasını gerektiren montaj görevleri dahildir. Şirket, hızlı deney ve geniş bir robot uygulama aralığı arasında dağıtım sağlamak amacıyla, NVIDIA AI platformu aracılığıyla geliştiricilere model sunuyor.

Rekabetçi Çıkarımlar

Cosmos Policy'nin tanıtılması, NVIDIA'yı geleneksel olarak özel robotika şirketleri ve araştırma kurumları tarafından hakim olan robot kontrol yazılımı pazarında daha agresif bir şekilde konumlandırıyor. Yerleşik kontrol yetenekleriyle önceden eğitilmiş bir vakfı model sunarak, NVIDIA, sofistike manipülasyon robotları dağıtmak isteyen ancak bu yetenekleri sıfırdan oluşturmak için dahili AI uzmanlığından yoksun olan şirketler için giriş bariyerini azaltıyor.

Bu alandaki rakipler, kendi robotik vakfı modelleri serisine sahip Google DeepMind ve genelleştirilebilir robot öğrenmesi üzerinde çalışan birkaç girişimi içeriyor. NVIDIA'nın avantajı, entegre donanım-yazılım ekosisteminde ve bu karmaşıklıktaki modelleri eğitmek ve çalıştırmak için gereken hesaplama temelini sağlayan GPU bilgisayar altyapısının muazzam kurulu tabanında yatıyor.

Robotika endüstrisi genel olarak, Cosmos Policy'nin gelişi, tekil bir robotun belirli görev programlaması olmaksızın çok çeşitli fizik görevlerini işleyebileceği, tekil amaçlı robot manipülasyonunun çağının araştırma özlemiyle başlamaktan ticari gerçekliğe kaydığını gösteriyor. Bu geçişin ne kadar hızlı gerçekleşeceği, Cosmos Policy gibi sistemlerin gerçek dünyada dağıtımında güvenilirliğine ve performansına bağlı olacaktır. Bu, endüstrinin gelecek aylar ve yıllar içinde yanıtlayacağı bir sorudur.

Bu makale The Robot Report tarafından yapılan raporlamaya dayanıyor. Orijinal makaleyi oku.