De Circle a Commerce
Cuando Google introdujo Circle to Search en enero de 2024, debutó como una solución elegante a un problema persistente: la fricción que implica buscar algo que ves en la pantalla de tu teléfono. En lugar de hacer una captura de pantalla, cambiar a un navegador, abrir Google Lens y cargar la captura, Circle to Search permitía a los usuarios simplemente presionar prolongadamente el botón de inicio y dibujar un círculo alrededor de lo que quisieran buscar — un texto, una imagen, un producto, una cara — sin salir de la aplicación en la que estaban. Desde entonces, la función se ha expandido a decenas de millones de dispositivos Android y Google la ha citado como una de las funciones impulsadas por AI más exitosas que ha lanzado en los últimos dos años.
Ahora Google está profundizando las capacidades de Circle to Search en una dirección que expandirá significativamente su utilidad y, no por coincidencia, su potencial comercial. Un conjunto de nuevas actualizaciones añade lo que Google llama características de inteligencia visual: la capacidad de reconocer y buscar artículos específicos de moda, productos de decoración del hogar y bienes de consumo dentro de imágenes — y mostrar resultados que se pueden comprar que permiten a los usuarios encontrar dónde se venden esos artículos, a qué precio y en qué configuraciones. Combinado con una nueva capacidad de ver el panorama completo en la búsqueda visual — entendiendo las relaciones espaciales y contextuales entre objetos en una escena — las actualizaciones representan una expansión significativa de lo que Circle to Search puede hacer.
Búsqueda de Moda: El Caso de Uso Principal
La capacidad de identificación de moda es la más inmediatamente orientada al usuario de las nuevas funciones. Usándola, un usuario puede circundar una prenda de ropa en un post de Instagram, un pin de Pinterest, una imagen de sitio web, o incluso una foto que haya tomado con su cámara, y recibir resultados que identifiquen el artículo específico (cuando es un producto reconocible), artículos visualmente similares de múltiples minoristas, e información sobre precios y disponibilidad actuales. El sistema utiliza modelos de incrustación visual de Google — la misma tecnología que subyace a la búsqueda de productos de Google Lens — pero integrado nativamente en la interfaz de Circle to Search y expandido para manejar vistas parciales, condiciones de iluminación variables, y artículos que están parcialmente oscurecidos.
El caso de uso práctico es uno que los consumidores conscientes de la moda reconocerán inmediatamente: ver algo que alguien está usando, querer encontrarlo o algo similar, y enfrentar el tedioso proceso de intentar describirlo en términos de búsqueda de texto. Circle to Search para moda colapsa esa fricción completamente. La precisión de la identificación varía según qué tan distintivo sea el artículo — una pieza de diseñador muy específica con marca o detalles reconocibles se identifica más fácilmente que una camiseta genérica de color sólido — pero los extensos datos de capacitación de Google en miles de millones de imágenes de productos le dan al sistema una amplia base de reconocimiento.
Reconocimiento de Decoración del Hogar y Productos
Las mismas capacidades de reconocimiento visual se extienden a decoración del hogar y electrónica de consumo, categorías en las que los usuarios frecuentemente encuentran artículos en fotografías — contenido editorial, posts de redes sociales, anuncios inmobiliarios — y quieren encontrarlos para comprar. Identificar una lámpara específica, un patrón de alfombra particular, o un modelo de televisión a partir de una fotografía de habitación ha sido históricamente un problema difícil para los sistemas de búsqueda de imágenes porque estos artículos a menudo aparecen en ángulos, bajo iluminación variada, y en vistas parciales que hacen que la identificación exacta sea difícil.
Los modelos actualizados de Google manejan estos escenarios más elegantemente al razonar sobre el objeto dentro de su contexto de escena en lugar de intentar hacerlo coincidir como una imagen de producto aislada. El sistema entiende que un objeto en el fondo de una fotografía de habitación probablemente sea muebles o decoración, incorpora ese antecedente en el proceso de reconocimiento, y muestra resultados que cuentan con el ángulo de visualización y las condiciones de iluminación en lugar de requerir una imagen de catálogo limpia para una identificación precisa.
La Dimensión Comercial
Sería ingenuo analizar estas actualizaciones sin reconocer su dimensión comercial. El negocio principal de publicidad de Google depende de conectar la intención del usuario con oportunidades comerciales, y la búsqueda visual representa un área de superficie enormemente sin explotar para esa conexión. Cuando un usuario circunda un producto en una imagen, eso es una expresión de intención de compra que es más específica y procesable que la mayoría de búsquedas de texto. La capacidad de mostrar inmediatamente resultados que se pueden comprar a partir de esa intención — y hacerlo dentro de aplicaciones donde los usuarios ya están comprometidos en lugar de requerirles que naveguen a Google — es enormemente valioso desde una perspectiva publicitaria y comercial.
Google Shopping ha sido un contribuyente de ingresos significativo durante años, y la integración de Circle to Search con resultados de compras esencialmente convierte cualquier imagen en un dispositivo Android en un punto de contacto comercial potencial. La compañía es cuidadosa de presentar esto como un beneficio para el usuario — encontrar lo que quieres fácilmente — y para la mayoría de casos de uso, ese marco es preciso. Pero la alineación entre la conveniencia del usuario y los intereses comerciales de Google no es coincidencia, y vale la pena notar que las mejoras de AI visual que más directamente habilitan el comercio son las que reciben la ubicación más prominente en los anuncios de productos de Google.
Mirando Hacia Adelante
Las actualizaciones de Circle to Search son parte de una evolución más amplia de las capacidades de AI en dispositivo de Google. A medida que Gemini Nano y modelos relacionados se vuelven capaces de ejecutar tareas cada vez más sofisticadas directamente en hardware móvil, las funciones que previamente requería enviar datos a los servidores de Google pueden ejecutarse localmente, con implicaciones para la latencia y la privacidad. Google ha indicado que parte del procesamiento visual de Circle to Search se trasladará hacia la ejecución en dispositivo a medida que mejora la eficiencia del modelo, lo que permitiría que la función funcione sin conexión y reduciría la transferencia de datos asociada con búsquedas visuales. Por ahora, la combinación de inteligencia en la nube y ejecución en dispositivo le da a Circle to Search un perfil de capacidad que es difícil para los competidores igualar sin acceso a la escala de datos de capacitación e infraestructura de Google.
Este artículo se basa en reportes de Google AI Blog. Lee el artículo original.




