Boston Dynamics usa Gemini para hacer más inteligente a Spot

Un pequeño anuncio con una gran implicación para la robótica

Boston Dynamics afirma que está utilizando Gemini de Google DeepMind para hacer más inteligente a Spot, y la empresa describe el modelo como una forma de aportar mejor razonamiento y mayor adaptabilidad a AIVI-Learning. El texto de origen proporcionado es breve, pero la dirección estratégica está clara. Una de las empresas de robótica más reconocibles está avanzando más allá del movimiento y el control hacia sistemas que puedan interpretar las situaciones de manera más flexible.

Eso importa porque la robótica lleva mucho tiempo destacando en tareas estructuradas y teniendo dificultades en entornos desordenados. Los robots pueden ser extraordinariamente fiables cuando el entorno es predecible, las reglas son fijas y el abanico de acciones posibles es reducido. El desafío comienza cuando las condiciones cambian, las instrucciones se vuelven ambiguas o una máquina tiene que decidir qué hacer a continuación sin seguir una secuencia estrictamente guionizada. Por eso, en este contexto, “razonamiento” y “adaptabilidad” no son adornos de marketing. Remiten a uno de los problemas de ingeniería más difíciles y aún sin resolver del campo.

Spot es una plataforma especialmente útil para esa transición. El robot cuadrúpedo ya está asociado con la movilidad en espacios difíciles o inseguros para los humanos, y su valor depende no solo de caminar bien, sino de entender lo que ve y cómo debe responder. Si Gemini mejora AIVI-Learning de la manera que Boston Dynamics sugiere, la ganancia no se limitaría a una interacción de lenguaje más natural. Se trataría de hacer que el comportamiento robótico sea menos frágil en entornos reales.

Qué significa “razonamiento” en la práctica

En robótica, un mejor razonamiento no tiene por qué significar inteligencia abstracta en el sentido humano. Puede significar vincular percepción y acción con mayor eficacia. Un robot puede necesitar interpretar una escena, inferir qué es relevante, decidir entre tareas en competencia y ajustarse cuando el entorno cambia. Incluso avances modestos en esa cadena pueden hacer que un sistema sea mucho más útil, porque reducen la necesidad de supervisión humana constante y de contingencias preprogramadas.

La adaptabilidad es igualmente práctica. Un robot que solo funciona en entornos cuidadosamente preparados tiene un alcance económico limitado. Un robot que puede afrontar variaciones en la disposición, la iluminación, los obstáculos o las instrucciones puede pasar a despliegues industriales y de campo más exigentes. Por eso resulta notable la combinación descrita aquí. Boston Dynamics aporta el hardware, el movimiento y la experiencia de implementación. Gemini se está posicionando como una capa que puede mejorar la interpretación y la toma de decisiones.

La importancia de AIVI-Learning en el anuncio también apunta a una tendencia más amplia. Las empresas de robótica necesitan cada vez más sistemas que aprendan y generalicen, en lugar de limitarse a ejecutar. La automatización tradicional sigue siendo poderosa, pero a menudo depende de una configuración minuciosa. Los enfoques asistidos por IA buscan acortar ese tiempo de preparación y permitir que los robots trasladen comportamientos útiles de un escenario a otro. Esa es la promesa, al menos, y es una promesa que la industria todavía no ha cumplido por completo.

front and side images of a researcher equipped with AI training devices, part of the XRZero-G0 system.

XRZero-G0 abre un conjunto de datos de robótica de 2.000 horas

X Square Robot ha publicado XRZero-G0 y un conjunto de datos multimodal de 2.000 horas con el objetivo de reducir la cantidad de datos de robots reales necesarios para sistemas de IA incorporada.

Read article

Por qué esta alianza encaja con la dirección del sector

El sector de la robótica se está orientando hacia una integración más estrecha entre sistemas físicos y grandes modelos de IA. El atractivo se entiende fácilmente. Los modelos fundacionales han demostrado que pueden manejar lenguaje, imágenes y reconocimiento de patrones a gran escala. Los robots físicos, en cambio, todavía necesitan mejores formas de convertir esa competencia amplia en acciones fiables. Unir ambas cosas es un siguiente paso obvio, aunque la brecha técnica entre comprensión y ejecución siga siendo grande.

Boston Dynamics no parte de cero. Sus robots ya son conocidos por su capacidad de movimiento y por demostraciones pulidas de autonomía. Pero la movilidad por sí sola no crea una máquina de uso general. La autonomía útil requiere criterio sobre objetivos, contexto y excepciones. Ahí es donde un modelo descrito como una mejora del razonamiento y la adaptabilidad podría tener un impacto desproporcionado si funciona bien bajo restricciones operativas reales.

El lado de las restricciones no debe ignorarse. Los sistemas físicos exigen una robustez que los productos de software a menudo no necesitan. Se puede perdonar a un chatbot una respuesta torpe. A un robot que opera alrededor de personas, equipos o terrenos irregulares no se le puede perdonar con tanta facilidad que interprete mal una situación. Por eso, cada avance en robótica con IA debe juzgarse no solo por su novedad, sino por su consistencia, seguridad y capacidad de recuperación cuando algo sale mal.

Qué observar a continuación

La gran pregunta ahora no es si los modelos de IA se conectarán con robots. Eso ya está ocurriendo en toda la industria. La verdadera pregunta es cuánta capacidad práctica añade esa integración. Boston Dynamics dice que Gemini mejorará el razonamiento y la adaptabilidad de Spot a través de AIVI-Learning. El próximo punto de validación será ver si esas mejoras aparecen en tareas que importan fuera de las demostraciones: inspección, navegación, interacción con operadores y operación en entornos cambiantes.

Si lo hacen, el anuncio parecerá parte de un punto de inflexión más amplio en la robótica. Si no lo hacen, aun así reflejará un consenso del sector: una mejor percepción y un mejor lenguaje no bastan por sí solos. Los robots necesitan una toma de decisiones más sólida en el circuito. En cualquier caso, la elección de Gemini por parte de Boston Dynamics pone de relieve dónde está creciendo la presión competitiva: no solo en construir máquinas que se muevan de forma impresionante, sino en construir máquinas que puedan decidir con mayor eficacia qué movimiento se requiere realmente.

Ese es el difícil punto intermedio en el que probablemente se ganará o perderá la robótica moderna. La capacidad de hardware lleva al robot a la sala. El razonamiento y la adaptabilidad determinan si puede hacer algo valioso una vez allí.

Este artículo se basa en la cobertura de The Robot Report. Leer el artículo original.

Anthropic pide auditorías vinculantes mientras replantea la IA como infraestructura estratégica

El director ejecutivo de Anthropic, Dario Amodei, dice que las reglas de transparencia ya no bastan y pide auditorías obligatorias de terceros para los sistemas de IA de frontera.

Read article

Originally published on therobotreport.com

Boston Dynamics recurre a Gemini mientras impulsa a Spot hacia un mejor razonamiento