ผู้เล่น Pokémon ฝึกสอน 30 พันล้านรูปภาพให้บริษัท สร้าง「AI World Model」ช่วยยกระดับอุตสาหกรรมหุ่นยนต์ส่งอาหาร

ChainNewsAbmedia

เกมเสริมความจริง (AR) ที่ได้รับความนิยมทั่วโลกอย่าง Pokémon Go ซึ่งพัฒนาโดย Niantic ซึ่งเป็นบริษัทในเครือของ Niantic AI บริษัทในเครือของ Niantic Spatial กำลังใช้ภาพถ่ายเมืองนับพันล้านภาพที่ผู้เล่นถ่ายไว้เป็นเวลาหลายปี เพื่อสร้างระบบตำแหน่งด้วยภาพ (Visual Positioning System) และโมเดลโลก AI ที่สามารถเข้าใจโลกแห่งความเป็นจริงได้ เทคโนโลยีนี้สามารถระบุตำแหน่งได้อย่างแม่นยำในสภาพแวดล้อมเมืองที่สัญญาณ GPS อาจไม่เสถียร และได้มีการร่วมมือกับบริษัทหุ่นยนต์ส่งของเพื่อทดสอบแล้ว ซึ่งเปิดทางใหม่สำหรับการนำทางของหุ่นยนต์และ AI ในโลกแห่งความเป็นจริง

ภาพถ่ายจากผู้เล่น Pokémon Go เป็นข้อมูลฝึก AI สร้างโมเดลโลกจากภาพเมือง

ตั้งแต่ Pokémon Go เปิดตัวในปี 2016 ก็กลายเป็นเกมยอดนิยมทั่วโลก ผู้เล่นใช้กล้องบนสมาร์ทโฟนจับ Pokémon ในโลกจริง เกม AR ที่พัฒนาโดย Niantic นี้ แม้จะเปิดตัวมาหลายปีแล้ว แต่ยังคงมีผู้เล่นมากกว่า 100 ล้านคนที่ใช้งานอยู่ในแต่ละปี

อย่างไรก็ตาม ระหว่างเล่น ผู้เล่นต้องคอยชี้กล้องสมาร์ทโฟนไปยังอาคารและแลนด์มาร์กในเมือง ซึ่งโดยไม่รู้ตัว บริษัทก็สะสมข้อมูลภาพจำนวนมากไว้

เมื่อเร็ว ๆ นี้ Niantic Spatial ซึ่งเป็นบริษัทด้านปัญญาประดิษฐ์ในเครือ Niantic ได้ประกาศว่า ได้รวบรวมและจัดระเบียบภาพถ่ายจากเมืองทั่วโลกประมาณ 30,000 ล้านภาพ ซึ่งภาพเหล่านี้มีข้อมูลตำแหน่งทางภูมิศาสตร์ที่แม่นยำ รวมถึงทิศทางของโทรศัพท์ ความเร็วในการเคลื่อนที่ และมุมกล้อง ข้อมูลเหล่านี้ถูกนำไปใช้ในการฝึก AI เพื่อสร้างโมเดลโลก (World Model) ที่สามารถเข้าใจพื้นที่ในโลกแห่งความเป็นจริงได้

(วิเคราะห์เชิงลึก: ข้อบกพร่องของ LLM ทำไม Yang Likun ถึงเน้นเส้นทางโมเดลโลกของ AMI)

ระบบตำแหน่งด้วยภาพเทียบกับ GPS: AI สามารถระบุที่ตั้งได้จากภาพอาคาร

รายงานจาก NewsForce ระบุว่า เทคโนโลยีล่าสุดของ Niantic Spatial คือ ระบบตำแหน่งด้วยภาพ (Visual Positioning System, VPS) ซึ่งเป็นโมเดล AI ที่วิเคราะห์ภาพอาคารหรือแลนด์มาร์กเพื่อระบุที่อยู่ของผู้ใช้อย่างแม่นยำถึงระดับเซนติเมตร

บริษัทระบุว่า ฐานข้อมูลปัจจุบันครอบคลุมแลนด์มาร์กกว่า 1 ล้านแห่งทั่วโลก ในแต่ละแห่งอาจมีภาพถ่ายหลายพันภาพที่ถ่ายในเวลาต่าง ๆ มุมต่าง ๆ และสภาพอากาศต่างกัน AI จะเปรียบเทียบคุณสมบัติของภาพเหล่านี้เพื่อคำนวณตำแหน่งและทิศทางของอุปกรณ์ ทำให้ได้ผลลัพธ์การระบุตำแหน่งที่แม่นยำในระดับหนึ่ง

หัวหน้าวิศวกรเทคโนโลยีของ Niantic Spatial คือ Brian McClendon กล่าวว่า เทคโนโลยีนี้แตกต่างจาก GPS แบบเดิมที่อาศัยสัญญาณดาวเทียม โดย VPS จะใช้ “สิ่งที่มองเห็น” เป็นตัวกำหนดตำแหน่ง:

ในเมืองที่เต็มไปด้วยตึกสูง สัญญาณ GPS มักผิดเพี้ยน ซึ่งอาจทำให้ตำแหน่งผิดพลาดไปหลายสิบเมตร หรือแม้แต่ทิศทางผิด

ความคลาดเคลื่อนนี้ไม่ส่งผลกระทบต่อผู้ใช้งานทั่วไปมากนัก แต่สำหรับหุ่นยนต์ที่ต้องการนำทางอย่างแม่นยำ อาจสร้างปัญหาใหญ่ได้ ดังนั้น การผสมผสานเทคโนโลยีการระบุที่อยู่ด้วยภาพจึงเป็นแนวทางที่บริษัทหุ่นยนต์ให้ความสนใจ

จากการเก็บภาพในเกม Pokémon ไปสู่การส่งของ: หุ่นยนต์ส่งของเริ่มนำเทคโนโลยีของ Niantic ไปใช้

ปัจจุบัน Niantic Spatial ได้ร่วมมือกับบริษัทหุ่นยนต์ส่งของ Coco Robotics เพื่อทดสอบเทคโนโลยีแล้ว โดย Coco ได้ติดตั้งหุ่นยนต์ส่งของประมาณ 1,000 ตัวในหลายเมืองในสหรัฐอเมริกาและยุโรป ซึ่งใช้สำหรับส่งอาหารและของชำ หุ่นยนต์เหล่านี้มีขนาดคล้ายกระเป๋าเดินทางขนาดเล็ก สามารถบรรจิ้งพิซซ่าใหญ่ได้ถึง 8 ชิ้น หรือถุงของชำ 4 ถุง

บริษัทระบุว่า แม้หุ่นยนต์จะเคลื่อนที่ไปแล้วกว่า 500,000 เที่ยว แต่บางครั้งก็ยังประสบปัญหา GPS คลาดเคลื่อน ทำให้หุ่นยนต์ไม่สามารถหยุดตรงหน้าร้านอาหารหรือหน้าบ้านลูกค้าได้อย่างแม่นยำ:

ด้วยโมเดลตำแหน่งด้วยภาพของ Niantic หุ่นยนต์สามารถใช้กล้อง 4 ตัวที่ติดตั้งบนตัววิเคราะห์สภาพแวดล้อมรอบตัว เพื่อระบุที่อยู่และทิศทางการเคลื่อนที่ได้อย่างแม่นยำมากขึ้น ช่วยเพิ่มความน่าเชื่อถือในการส่งของ

ยุคของหุ่นยนต์มาแล้ว: Niantic ต้องการสร้าง “แผนที่มีชีวิต”

John Hanke ซีอีโอของ Niantic Spatial กล่าวว่า จุดเริ่มต้นของการพัฒนาเทคโนโลยีตำแหน่งด้วยภาพคือเพื่อสนับสนุนแว่น AR และแอปพลิเคชันเสริมความจริง แต่เมื่ออุตสาหกรรมหุ่นยนต์เติบโตอย่างรวดเร็ว บริษัทจึงเปลี่ยนแนวทางไปสู่การนำทางของหุ่นยนต์

เขาอธิบายว่า ขณะนี้บริษัทกำลังสร้างระบบที่เรียกว่า “แผนที่มีชีวิต (Living Map)” ซึ่งเป็นโมเดลโลกดิจิทัลที่ละเอียดและอัปเดตอย่างต่อเนื่อง สามารถปรับปรุงตามการเปลี่ยนแปลงในโลกจริงได้อย่างต่อเนื่อง

ในอนาคต หุ่นยนต์ส่งของ อุปกรณ์อัจฉริยะ และแม้แต่แว่น AR อาจกลายเป็นแหล่งข้อมูลของแผนที่ ส่งข้อมูลสภาพแวดล้อมกลับมาอย่างต่อเนื่อง ทำให้โลกดิจิทัลใกล้เคียงกับภาพของโลกจริงมากขึ้นเรื่อย ๆ

AI ต้องเข้าใจโลกแห่งความเป็นจริง: “World Model” กลายเป็นจุดสนใจใหม่ของเทคโนโลยี

ในช่วงไม่กี่ปีที่ผ่านมา วงการวิจัย AI เริ่มให้ความสนใจกับแนวคิด “โมเดลโลก (World Model)” แม้ว่าโมเดลภาษาใหญ่ (LLM) จะทำผลงานได้ดีในด้านการประมวลผลข้อความและความรู้ แต่ยังคงมีข้อจำกัดในด้านความเข้าใจพื้นที่ทางกายภาพและสิ่งแวดล้อมจริง

โดยการผสมผสานข้อมูลแผนที่ ภาพถ่าย และข้อมูลสิ่งแวดล้อม โมเดลโลกพยายามทำให้ AI เข้าใจวัตถุ ความสัมพันธ์ในพื้นที่ และการเปลี่ยนแปลงของสิ่งแวดล้อม รวมถึงบริษัทอย่าง Google DeepMind ก็อยู่ระหว่างการพัฒนาโมเดลที่สามารถสร้างโลกเสมือนเพื่อใช้ในการฝึก AI ตัวแทน

ในขณะเดียวกัน Niantic Spatial ก็ใช้กลยุทธ์แตกต่าง โดยการสะสมภาพถ่ายจากโลกจริงจำนวนมาก เพื่อสร้างโมเดลดิจิทัลของโลกอย่างค่อยเป็นค่อยไป เมื่อข้อมูลสะสมมากขึ้น ระบบนี้อาจกลายเป็นโครงสร้างพื้นฐานสำคัญสำหรับหุ่นยนต์และ AI ในการเข้าใจโลกแห่งความเป็นจริงในอนาคต

บทความนี้ “ผู้เล่น Pokémon ฝึก AI สร้างโมเดลโลกด้วยภาพ 30,000 ล้านภาพ ช่วยอุตสาหกรรมหุ่นยนต์ส่งของ” ปรากฏเป็นครั้งแรกใน Chain News ABMedia

ดูต้นฉบับ
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น