Boston Dynamics utilise Gemini pour rendre Spot plus intelligent

Une petite annonce aux grandes implications pour la robotique

Boston Dynamics indique utiliser Gemini de Google DeepMind pour rendre Spot plus intelligent, l’entreprise présentant le modèle comme un moyen d’apporter de meilleurs raisonnements et une plus grande adaptabilité à AIVI-Learning. Le texte source fourni est bref, mais la direction stratégique est claire. L’une des sociétés de robotique les plus reconnaissables pousse au-delà du mouvement et du contrôle vers des systèmes capables d’interpréter les situations avec davantage de souplesse.

Cela compte, parce que la robotique a longtemps excellé dans les tâches structurées et peiné dans les situations chaotiques. Les robots peuvent être extraordinairement fiables lorsque l’environnement est prévisible, que les règles sont fixes et que l’éventail des actions possibles est limité. La difficulté commence lorsque les conditions changent, que les consignes deviennent ambiguës ou qu’une machine doit décider quoi faire ensuite sans suivre une séquence étroitement scénarisée. Le « raisonnement » et l’« adaptabilité » ne sont donc pas, dans ce contexte, de simples arguments marketing. Ils renvoient à l’un des problèmes d’ingénierie les plus difficiles et non résolus du secteur.

Spot est une plateforme particulièrement utile pour ce passage. Le robot quadrupède est déjà associé à la mobilité dans des espaces difficiles ou dangereux pour les humains, et sa valeur ne dépend pas seulement de sa capacité à marcher, mais aussi de sa compréhension de ce qu’il voit et de la manière dont il doit réagir. Si Gemini améliore AIVI-Learning comme Boston Dynamics le suggère, le gain ne se limiterait pas à une interaction en langage naturel plus fluide. Il s’agirait de rendre le comportement du robot moins fragile dans des environnements réels.

Ce que signifie le « raisonnement » en pratique

En robotique, un meilleur raisonnement ne doit pas nécessairement signifier une intelligence abstraite au sens humain. Il peut s’agir de relier plus efficacement la perception à l’action. Un robot peut devoir interpréter une scène, déduire ce qui est pertinent, arbitrer entre plusieurs tâches et s’adapter lorsque l’environnement change. Même des progrès modestes dans cette chaîne peuvent rendre un système beaucoup plus utile, car ils réduisent le besoin de supervision humaine constante et de contingences préprogrammées.

L’adaptabilité est tout aussi concrète. Un robot qui ne fonctionne que dans des environnements soigneusement préparés a une portée économique limitée. Un robot capable de gérer des variations d’agencement, d’éclairage, d’obstacles ou d’instructions peut accéder à des déploiements industriels et de terrain plus exigeants. C’est pourquoi l’association décrite ici est notable. Boston Dynamics apporte le matériel, le mouvement et l’expérience du déploiement. Gemini est positionné comme une couche susceptible d’améliorer l’interprétation et la prise de décision.

L’importance d’AIVI-Learning dans l’annonce laisse aussi entrevoir une tendance plus large. Les entreprises de robotique ont de plus en plus besoin de systèmes qui apprennent et généralisent plutôt que de simplement exécuter. L’automatisation traditionnelle reste puissante, mais elle dépend souvent d’une mise en place minutieuse. Les approches assistées par l’IA visent à réduire ce temps de configuration et à permettre aux robots de transférer un comportement utile d’un scénario à l’autre. C’est la promesse, du moins, et c’est une promesse que le secteur n’a pas encore pleinement tenue.

front and side images of a researcher equipped with AI training devices, part of the XRZero-G0 system.

XRZero-G0 ouvre un jeu de données robotique de 2 000 heures

X Square Robot a publié XRZero-G0 et un jeu de données multimodal de 2 000 heures afin de réduire la quantité de données réelles de robots nécessaire aux systèmes d’IA incarnée.

Read article

Pourquoi ce partenariat correspond à la direction du secteur

Le secteur de la robotique se dirige vers une intégration plus étroite entre systèmes physiques et grands modèles d’IA. L’attrait est facile à comprendre. Les modèles de fondation ont montré qu’ils pouvaient gérer le langage, les images et la reconnaissance de formes à grande échelle. Les robots physiques, eux, ont encore besoin de meilleures façons de convertir cette compétence générale en action fiable. Les réunir est une suite logique, même si l’écart technique entre compréhension et exécution reste important.

Boston Dynamics ne part pas de zéro. Ses robots sont déjà connus pour leurs mouvements de grande qualité et pour des démonstrations polies d’autonomie. Mais la mobilité seule ne crée pas une machine polyvalente. Une autonomie utile exige un jugement sur les objectifs, le contexte et les exceptions. C’est là qu’un modèle présenté comme améliorant le raisonnement et l’adaptabilité pourrait avoir un impact disproportionné s’il fonctionne bien dans des contraintes opérationnelles réelles.

Il ne faut pas négliger ces contraintes. Les systèmes physiques exigent une robustesse que les produits logiciels n’ont souvent pas à ce degré. Un chatbot peut être pardonné pour une réponse maladroite. Un robot opérant autour de personnes, d’équipements ou sur un terrain irrégulier ne peut pas être pardonné aussi facilement s’il interprète mal une situation. C’est pourquoi chaque progrès en robotique pilotée par l’IA doit être jugé non seulement sur la nouveauté, mais aussi sur la constance, la sécurité et la capacité de récupération lorsque les choses tournent mal.

Ce qu’il faut surveiller ensuite

La question principale n’est plus de savoir si des modèles d’IA seront connectés à des robots. C’est déjà le cas dans tout le secteur. La vraie question est de savoir combien de capacités pratiques cette intégration ajoute. Boston Dynamics affirme que Gemini améliorera le raisonnement et l’adaptabilité de Spot via AIVI-Learning. Le prochain point de preuve sera de voir si ces améliorations apparaissent dans des tâches qui comptent en dehors des démonstrations : inspection, navigation, interaction avec les opérateurs et fonctionnement dans des environnements changeants.

Si c’est le cas, l’annonce ressemblera à une partie d’un tournant plus large de la robotique. Sinon, elle reflétera tout de même un consensus de l’industrie : une meilleure perception et un meilleur langage ne suffisent pas à eux seuls. Les robots ont besoin d’une prise de décision plus solide dans la boucle. Dans tous les cas, le choix de Gemini par Boston Dynamics met en évidence là où la pression concurrentielle se construit : non seulement dans la fabrication de machines qui se déplacent de manière impressionnante, mais aussi dans celle de machines capables de décider plus efficacement quel mouvement est réellement nécessaire.

C’est ce terrain intermédiaire difficile où la robotique moderne se gagnera ou se perdra probablement. La capacité matérielle fait entrer un robot dans la pièce. Le raisonnement et l’adaptabilité déterminent s’il peut y faire quelque chose d’utile.

Cet article s’appuie sur un reportage de The Robot Report. Lire l’article original.

Anthropic demande des audits contraignants tout en requalifiant l’IA en infrastructure stratégique

Le PDG d’Anthropic, Dario Amodei, dit que les règles de transparence ne suffisent plus et appelle à des audits obligatoires par des tiers pour les systèmes d’IA de pointe.

Read article

Originally published on therobotreport.com

Boston Dynamics se tourne vers Gemini pour pousser Spot vers un meilleur raisonnement