Jugadores de Pokémon entrenan 300 mil millones de fotos para la empresa para construir un "modelo mundial de IA", impulsando la industria de robots de entrega

ChainNewsAbmedia

La compañía de IA de Niantic, Niantic Spatial, subsidiaria del desarrollador del popular juego de realidad aumentada Pokémon Go, está utilizando miles de millones de imágenes urbanas tomadas por los jugadores durante años para crear un sistema de “localización visual” y un modelo del mundo AI que comprende el entorno real. Esta tecnología puede localizar con precisión en entornos urbanos con señales GPS inestables y ya ha sido probada en colaboración con empresas de robots de reparto, abriendo nuevas posibilidades para la navegación de robots y IA en el mundo real.

Imágenes de jugadores de Pokémon Go como datos de entrenamiento para IA, construcción de modelos del mundo a partir de fotos urbanas

Desde su lanzamiento en 2016, Pokémon Go se convirtió rápidamente en un juego globalmente popular, donde los jugadores capturan Pokémon en el mundo real usando la cámara del teléfono. Este famoso juego de realidad aumentada (AR), desarrollado por Niantic, mantiene aún hoy más de 100 millones de jugadores activos anualmente, incluso después de varios años.

Sin embargo, durante el juego, los jugadores deben apuntar continuamente la cámara a edificios y puntos de referencia urbanos, acumulando inadvertidamente una gran cantidad de datos de imágenes.

Recientemente, Niantic Spatial, la compañía de IA de Niantic, anunció que ha recopilado y organizado aproximadamente 30 mil millones de fotos de entornos urbanos en todo el mundo, todas con información precisa de ubicación y datos de captura, como dirección del teléfono, velocidad de movimiento y ángulo de toma. Estos datos se están utilizando para entrenar IA y construir un “modelo del mundo” que comprende el espacio real.

(Análisis profundo: ¿Limitaciones de los LLM? ¿Por qué Yang Likun apuesta por la ruta del Modelo del Mundo?)

Sistema de localización visual vs GPS: IA puede determinar la posición exacta mediante imágenes de edificios

Según NewsForce, la tecnología más reciente de Niantic Spatial es un Sistema de Localización Visual (VPS). Este modelo de IA puede analizar fotos de edificios o puntos de referencia para determinar la ubicación del usuario con una precisión que puede llegar a centímetros.

La compañía afirma que su base de datos ya cubre más de un millón de puntos de referencia en todo el mundo. En cada lugar, se pueden acumular miles de imágenes tomadas en diferentes momentos, desde distintos ángulos y en diversas condiciones climáticas. La IA, comparando estas características visuales, puede calcular la posición del dispositivo y su dirección de vista, logrando una localización bastante precisa.

El director de tecnología de Niantic Spatial, Brian McClendon, señala que esto difiere del GPS tradicional, que depende de señales satelitales. En cambio, VPS determina la posición mediante “lo que ve”, especialmente útil en entornos urbanos con edificios densos donde las señales GPS a menudo fallan, causando errores de decenas de metros o incluso direcciones incorrectas.

Este tipo de error puede no afectar mucho a los usuarios comunes, pero para robots que requieren navegación precisa, puede ser un problema grave. Por ello, la tecnología de localización basada en reconocimiento de imágenes es una solución que también interesa a las empresas de robots.

De capturar Pokémon a entregar comida: robots de reparto comienzan a usar la tecnología de Niantic

Niantic Spatial ya ha comenzado a colaborar con la empresa de robots de reparto Coco Robotics para realizar pruebas. En varias ciudades de EE. UU. y Europa, despliegan alrededor de 1,000 robots de reparto, principalmente para entregar comida y comestibles. Estos robots, del tamaño de una pequeña maleta, pueden transportar hasta 8 pizzas grandes o 4 bolsas de compras.

La compañía indica que, aunque los robots han realizado más de 500,000 entregas, a veces aún enfrentan dificultades para detenerse con precisión en la entrada de restaurantes o en las puertas de los clientes debido a errores en la localización GPS:

Con el modelo de localización visual de Niantic, los robots pueden usar sus cuatro cámaras para analizar el entorno y determinar con mayor precisión su posición y dirección, mejorando la fiabilidad de las entregas.

La era de los robots está llegando: Niantic quiere crear un “Mapa Vivo”

El CEO de Niantic Spatial, John Hanke, explica que el desarrollo inicial de la tecnología de localización visual fue para apoyar gafas AR y aplicaciones de realidad aumentada, pero con el rápido crecimiento de la industria de robots, la compañía empezó a enfocar la tecnología en la navegación de robots.

Él menciona que están construyendo un sistema llamado “Mapa Vivo”, un modelo digital del mundo altamente detallado y en constante actualización, que refleja los cambios en el entorno real.

En el futuro, robots de reparto, dispositivos inteligentes e incluso dispositivos AR podrán convertirse en fuentes de datos para el mapa, enviando continuamente información del entorno y acercando cada vez más el mundo digital a la realidad dinámica.

La IA necesita entender el mundo real: “Modelo del Mundo” como nuevo foco tecnológico

En los últimos años, la investigación en IA ha puesto énfasis en el concepto de “Modelo del Mundo”. Aunque los modelos de lenguaje grande (LLM) sobresalen en procesamiento de texto y conocimiento, todavía enfrentan limitaciones claras en la comprensión del espacio físico y el entorno real.

Al combinar mapas, imágenes e información del entorno, el Modelo del Mundo busca que la IA entienda objetos, relaciones espaciales y cambios en el entorno. Empresas como Google DeepMind también están desarrollando modelos que generan mundos virtuales para entrenar agentes de IA.

Niantic Spatial adopta una estrategia diferente, utilizando grandes cantidades de imágenes del mundo real para reconstruir progresivamente un modelo digital del entorno físico. Con la acumulación continua de datos, este sistema podría convertirse en una infraestructura clave para que robots y IA comprendan el mundo real en el futuro.

Este artículo “Los jugadores de Pokémon entrenan 30 mil millones de fotos para construir un ‘Modelo del Mundo AI’, impulsando la industria de robots de reparto” fue publicado originalmente en Chain News ABMedia.

Ver originales
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios