Gemma 4 de Google lleva IA agéntica en el dispositivo a los teléfonos

Google está trasladando más trabajo de IA al propio dispositivo

El lanzamiento más reciente de Gemma 4 por parte de Google señala una apuesta más ambiciosa por la IA local que se ejecuta directamente en teléfonos y otro hardware en lugar de depender de la nube. Según The Decoder, la nueva familia de modelos de código abierto puede procesar texto, imágenes y audio íntegramente en el dispositivo, y también puede usar herramientas mediante “agent skills” integradas, como acceso a Wikipedia, mapas interactivos y generación de códigos QR.

Esa combinación importa porque cambia el significado práctico de la IA móvil. Muchos sistemas de consumo ya se presentan como asistentes, pero su procesamiento principal suele seguir dependiendo de servidores remotos. Gemma 4 se posiciona de otra manera. El atractivo no es solo la velocidad o la comodidad; es la capacidad de mantener los datos en el dispositivo y, al mismo tiempo, permitir una gama más amplia de acciones.

El momento encaja con una tendencia más amplia del sector. A medida que los modelos se vuelven más eficientes y mejoran los chips móviles, las empresas intentan trasladar más inteligencia al hardware de borde. Eso puede reducir la latencia, bajar los costos de servidor y hacer más creíbles las promesas de privacidad. Google ahora trata de convertir esa dirección técnica en una plataforma para desarrolladores y en un canal de distribución orientado al consumidor al mismo tiempo.

Los modelos más pequeños apuntan a los smartphones convencionales

The Decoder dice que Gemma 4 llega en cuatro variantes. Dos de ellas, E2B y E4B, están diseñadas específicamente para smartphones. La “E” se refiere a parámetros efectivos, o los parámetros activos durante la inferencia. Al cuantizarse, el modelo E2B ocupa alrededor de 1.3 GB en el dispositivo, mientras que E4B necesita cerca de 2.5 GB.

Esos tamaños son notables porque apuntan a una estrategia de despliegue práctica y no a un modelo de demostración pensado solo para hardware premium. El informe dice que E2B y E4B pueden funcionar en teléfonos con 6 GB y 8 GB de RAM, respectivamente. Si eso se mantiene en el uso cotidiano, amplía considerablemente la base instalada disponible y hace que la IA multimodal local dependa menos de los dispositivos insignia.

Google también dice que las variantes para teléfono funcionan hasta cuatro veces más rápido que la generación anterior, al tiempo que reducen el consumo de batería hasta en un 60 por ciento. Los propios benchmarks de Arm, citados por The Decoder, muestran ganancias de procesamiento aún mayores en chips Arm más nuevos. La experiencia real variará según el dispositivo, pero el mensaje es claro: la arquitectura del modelo y la optimización del hardware están empezando a importar tanto como el tamaño bruto.

Google y OpenAI exponen operaciones separadas de abuso de IA vinculadas con China

Google presentó una demanda por una supuesta red de fraude habilitada por IA, mientras OpenAI dijo que desmanteló dos clústeres de influencia vinculados con China que apuntaban a debates en EE. UU. y narrativas sobre infraestructura.

Read article

La historia más importante es la capacidad agéntica sin la nube

Lo que distingue este lanzamiento de una simple actualización de eficiencia es el énfasis en el uso de herramientas. Gemma 4 no se describe solo como un modelo multimodal compacto. Se presenta como un sistema agéntico que puede llamar de forma autónoma a herramientas específicas mediante habilidades incluidas. En términos prácticos, eso significa que un modelo que se ejecuta localmente puede hacer más que responder preguntas a partir de un prompt; puede recuperar información, trabajar con mapas o generar resultados útiles sin enviar la interacción a un servicio remoto.

Esa arquitectura tiene implicaciones estratégicas. Los agentes en el dispositivo prometen un equilibrio distinto entre funcionalidad y privacidad. Si el modelo, las entradas del usuario y la orquestación de herramientas permanecen en hardware que controla el usuario, las empresas pueden ofrecer una experiencia de IA más privada y, al mismo tiempo, admitir flujos de trabajo más ricos.

También abre una vía para la personalización. The Decoder informa que los desarrolladores pueden crear y compartir habilidades personalizadas a través de GitHub. Eso sugiere que Google no solo está lanzando una familia de modelos, sino que intenta sembrar un ecosistema en torno a comportamientos portables y locales de IA.

Google combina un lanzamiento abierto con una amplia distribución

Gemma 4 se lanza bajo la licencia Apache 2.0, que The Decoder describe como favorable para el uso comercial. Esto importa porque la licencia puede determinar si una familia de modelos se convierte en una base seria de desarrollo o sigue siendo, en gran medida, una curiosidad de investigación. Una licencia permisiva reduce la fricción para la experimentación, la adaptación y el despliegue comercial.

Google también está distribuyendo la experiencia mediante la app gratuita Google AI Edge Gallery para Android e iOS. The Decoder dice que, desde el lanzamiento de Gemma 4, la app subió al cuarto puesto entre las apps gratuitas de productividad más descargadas en la App Store de Apple en iOS, por detrás de Claude, Gemini y ChatGPT. Aunque los rankings fluctúan, ese dato sugiere un nivel significativo de curiosidad temprana de los consumidores por experiencias locales de IA.

El informe añade que Gemma 4 se basa en la misma base de investigación que el modelo propietario Gemini 3 de Google y que las variantes para smartphones servirán como base de Gemini Nano 4 en Android. Esa relación es importante. Implica que Google está tratando las líneas de modelos abiertos y propietarios como parte de la misma pila más amplia, con Gemma actuando tanto como plataforma para desarrolladores como banco de pruebas para el despliegue móvil.

front and side images of a researcher equipped with AI training devices, part of the XRZero-G0 system.

XRZero-G0 abre un conjunto de datos de robótica de 2.000 horas

X Square Robot ha publicado XRZero-G0 y un conjunto de datos multimodal de 2.000 horas con el objetivo de reducir la cantidad de datos de robots reales necesarios para sistemas de IA incorporada.

Read article

Por qué este lanzamiento importa en la competencia por las plataformas de IA

El mercado de la IA se está dividiendo cada vez más en varios enfrentamientos superpuestos: modelos de frontera en la nube, despliegue empresarial, ecosistemas de desarrolladores y, ahora, inteligencia nativa del dispositivo. Gemma 4 da a Google una posición más fuerte en las dos últimas categorías. Al combinar pesos abiertos, optimización móvil, uso de herramientas y una app de consumo, la empresa intenta hacer que la IA local sea más tangible tanto para constructores como para usuarios finales.

El movimiento también refleja una necesidad competitiva. Si la IA va a convertirse en una capa predeterminada en teléfonos y otros dispositivos personales, las empresas que controlen modelos locales eficientes y la experiencia de desarrollo asociada obtendrán una ventaja importante. El acceso a la nube seguirá siendo central para cargas de trabajo más grandes, pero no todas las interacciones necesitan una respuesta a escala de centro de datos.

Gemma 4 apunta, por tanto, a un futuro más híbrido. Algunas tareas de IA permanecerán remotas porque requieren modelos más grandes o más capacidad de cómputo. Otras se ejecutarán cada vez más donde ya está el usuario: en el teléfono, dentro del sistema operativo y cerca de datos personales sensibles.

Para Google, el lanzamiento es un intento de dar forma a ese futuro desde temprano. Para los desarrolladores, ofrece una base local más práctica. Para los usuarios, sugiere que “IA en tu teléfono” pronto podría significar algo más literal que un acceso directo de marca a la nube.

Este artículo está basado en la cobertura de The Decoder. Leer el artículo original.

Originally published on the-decoder.com

Google Avanza Más con la IA en el Dispositivo con Gemma 4 y Habilidades de Agente Integradas