شركة Niantic، مطورة لعبة الواقع المعزز العالمية Pokémon Go، التابعة لشركة Niantic Spatial، وهي شركة ذكاء اصطناعي، تستغل مئات الملايين من الصور الحضرية التي التقطها اللاعبون على مدى سنوات، لبناء نظام تحديد المواقع البصري (Visual Positioning System) ونموذج عالمي للذكاء الاصطناعي قادر على فهم العالم الحقيقي. هذه التقنية يمكنها تحديد المواقع بدقة عالية في بيئات المدينة التي تكون فيها إشارات GPS غير مستقرة، وقد تم اختبارها بالفعل بالتعاون مع شركات الروبوتات التوصيل، لفتح آفاق جديدة لقدرة الروبوتات والذكاء الاصطناعي على التنقل في العالم الحقيقي.
صور لاعبي Pokémon تُستخدم كبيانات تدريب للذكاء الاصطناعي، وصور المدن تُستخدم لبناء نموذج عالمي
منذ إطلاق Pokémon Go في عام 2016، سرعان ما أصبح لعبة شعبية على مستوى العالم، حيث يلتقط اللاعبون البوكيمونات عبر كاميرات هواتفهم في العالم الحقيقي. هذه اللعبة الشهيرة التي طورتها Niantic، على الرغم من مرور سنوات على إصدارها، لا تزال تحافظ على أكثر من مئة مليون لاعب نشط سنويًا.
ومع ذلك، خلال عملية اللعب، يحتاج اللاعبون إلى توجيه كاميرات هواتفهم باستمرار نحو المباني والمعالم في المدينة، مما أدى بشكل غير مقصود إلى جمع كمية هائلة من الصور.
أعلنت شركة Niantic Spatial، وهي شركة الذكاء الاصطناعي التابعة لـ Niantic، مؤخرًا أنها جمعت ونظمت حوالي 30 مليار صورة من بيئات حضرية حول العالم، تحتوي جميعها على معلومات دقيقة عن الموقع الجغرافي، مثل اتجاه الهاتف، سرعة الحركة، وزاوية التصوير. تُستخدم هذه البيانات الآن لتدريب نماذج الذكاء الاصطناعي لبناء “نموذج عالمي” (World Model) قادر على فهم الفضاء الحقيقي.
(تحليل عميق: هل توجد عيوب في نماذج اللغة الكبيرة؟ لماذا يراهن Yang Likun على مسار النموذج العالمي في AMI؟)
نظام تحديد المواقع البصري مقابل GPS: الذكاء الاصطناعي يمكنه تحديد الموقع بدقة من خلال صور المباني والمعالم
ذكرت صحيفة NewsForce أن التقنية الجديدة التي طورتها Niantic Spatial هي نظام تحديد المواقع البصري (Visual Positioning System، VPS). هذا النموذج من الذكاء الاصطناعي يستطيع من خلال تحليل صور المباني أو المعالم، تحديد موقع المستخدم بدقة تصل إلى سنتيمترات.
قالت الشركة إن قاعدة البيانات الخاصة بها تغطي الآن أكثر من مليون معلم حول العالم. في كل موقع، يمكن أن تتجمع آلاف الصور الملتقطة في أوقات مختلفة، من زوايا مختلفة، وتحت ظروف جوية متنوعة. من خلال مقارنة ميزات هذه الصور، يمكن للذكاء الاصطناعي حساب موقع الجهاز واتجاه النظر، مما يوفر تحديدًا دقيقًا نسبيًا للموقع.
وأشار بريان ماكليندون، رئيس قسم التكنولوجيا في Niantic Spatial، إلى أن هذا يختلف عن نظام GPS التقليدي، الذي يعتمد على إشارات الأقمار الصناعية، حيث يعتمد VPS على “رؤية” البيئة المحيطة:
في بيئات المدينة ذات المباني الكثيفة، غالبًا ما تتعرض إشارات GPS للانحراف، مما قد يؤدي إلى أخطاء في تحديد الموقع تصل إلى عدة أمتار، وأحيانًا إلى خطأ في الاتجاه.
هذه الأخطاء ليست مشكلة كبيرة للمستخدمين العاديين، لكنها قد تسبب مشاكل كبيرة للروبوتات التي تتطلب دقة عالية في التنقل. لذلك، فإن تقنية تحديد الموقع باستخدام الصور تعتبر حلاً مهمًا يركز عليه شركات الروبوتات.
من جمع الأغراض إلى توصيل الطلبات: الروبوتات التوصيل تبدأ في اعتماد تقنية Niantic
بدأت شركة Niantic Spatial بالتعاون مع شركة الروبوتات التوصيل Coco Robotics في اختبار التقنية الجديدة. قامت Coco بنشر حوالي 1000 روبوت توصيل في مدن متعددة في الولايات المتحدة وأوروبا، وتستخدم بشكل رئيسي في توصيل الطعام والمواد الغذائية. هذه الروبوتات بحجم حقيبة سفر صغيرة، ويمكنها حمل ما يصل إلى 8 بيتزا كبيرة أو 4 أكياس من البقالة.
قالت الشركة إن الروبوتات أكملت أكثر من 500 ألف عملية توصيل حتى الآن، لكن أحيانًا تعاني من ضعف دقة تحديد الموقع عبر GPS، مما يصعب عليها التوقف بدقة عند أبواب المطاعم أو منازل العملاء:
باستخدام نموذج تحديد الموقع البصري من Niantic، يمكن للروبوتات تحليل البيئة المحيطة باستخدام أربع كاميرات مثبتة عليها، مما يساعدها على تحديد الموقع واتجاه الحركة بدقة أكبر، وبالتالي تحسين موثوقية التوصيل.
عصر الروبوتات قادم: Niantic تسعى لبناء “خريطة حية”
قال جون هانكي، الرئيس التنفيذي لشركة Niantic Spatial، إن الهدف من تطوير تقنية تحديد الموقع البصري كان دعم نظارات الواقع المعزز وتطبيقات الواقع الممتد، لكن مع التطور السريع لصناعة الروبوتات، بدأوا في توجيه التقنية نحو تنقل الروبوتات.
وأضاف أن الشركة تعمل على إنشاء نظام يُسمى “الخريطة الحية” (Living Map)، وهو نموذج رقمي دقيق ومتجدد باستمرار، يمكنه التحديث تلقائيًا مع تغيرات العالم الحقيقي.
في المستقبل، قد تصبح روبوتات التوصيل، والأجهزة الذكية، وحتى أجهزة الواقع المعزز، مصادر لبيانات الخرائط، وتقوم بإرسال معلومات بيئية باستمرار، مما يجعل العالم الرقمي يقترب أكثر من الواقع الديناميكي الحقيقي.
الذكاء الاصطناعي بحاجة إلى فهم العالم الحقيقي: “نموذج العالم” يصبح محور التكنولوجيا الجديد
في السنوات الأخيرة، بدأ مجال أبحاث الذكاء الاصطناعي يركز على مفهوم “نموذج العالم” (World Model). على الرغم من أن نماذج اللغة الكبيرة (LLMs) تظهر أداءً ممتازًا في معالجة النصوص والمعرفة، إلا أنها لا تزال تعاني من قيود واضحة في فهم الفضاء الفيزيائي والبيئة الحقيقية.
من خلال دمج الخرائط، الصور، والمعلومات البيئية، يحاول نموذج العالم تمكين الذكاء الاصطناعي من فهم الأجسام، العلاقات المكانية، والتغيرات في البيئة. شركات مثل Google DeepMind تطور نماذج قادرة على توليد عوالم افتراضية لاستخدامها في تدريب وكلاء الذكاء الاصطناعي.
أما شركة Niantic Spatial، فتتبنى استراتيجية مختلفة، حيث تعتمد على جمع كميات هائلة من الصور الحقيقية من العالم الحقيقي، لإعادة بناء النموذج الرقمي للعالم الحقيقي تدريجيًا. ومع تراكم البيانات، قد يصبح هذا النظام البنية التحتية الأساسية لفهم الروبوتات والذكاء الاصطناعي للعالم الحقيقي في المستقبل.
هذه المقالة نُشرت أولاً على ABMedia، بعنوان “لاعبو البوكيمون يدرّبون الشركة على 30 مليار صورة لبناء ‘نموذج عالمي للذكاء الاصطناعي’، يدعم صناعة الروبوتات التوصيل”.