頭にヘッドバンド型カメラを付けて、マンゴーを切ったり靴ひもを結んだりといった日々の作業を、タミル・ナードゥ州の労働者が毎日こなしている。AI搭載ロボット向けの学習データを供給するために、1時間あたり約$2.40を稼いでいる。この映像は「一人称動画(egocentric video)」と呼ばれ、CEOのラヴィ・シャンカールが設立したObjectwaysのような企業が処理しており、Amazonを含む米国のITクライアントに提供している。ゴールドマン・サックスは、人型ロボット市場が2035年に$38 billionに到達する見通しだとしており、この種の「人間の文脈に基づくデータ」に対する需要を押し上げる。こうした取り組みは、労働者のプライバシーや賃金の公平性について議論を呼んでおり、インドの低コストの労働が米国の高マージンなロボティクス製品を支えている。
タミル・ナードゥ州の労働者がAI学習データを作るために日々の作業を撮影
インド南部では、スマートフォンのカメラを頭に装着して、自分自身が普通の作業を行う様子を撮り記録する人々がいる——マンゴーを切る、靴ひもを結ぶ、コーヒーを淹れる、といった行為だ。得られた一人称の映像は、手が作業の中でどのように動くかを捉え、意図・動き・環境を1本の流れの中で対応づける。この一人称動画の形式は、手順ごとのコーディングを必要とせずにロボットに模倣を教えられるため、AI開発者に重宝されている。労働者は、自宅や職場でのこうした作業を記録するために、1時間あたり約$2.40が支払われる。記事が挙げている例の1つは、タミル・ナードゥ州でマンゴーの切り分けを撮影しているナギレッディ・スリラミヤチャンドラだ。
Objectwaysが一人称動画を米国のITクライアントに提供
ラヴィ・シャンカールが設立したデータラベリング企業Objectwaysは、AI学習の供給チェーンにおける拠点として運営されている。従業員は、準備された家屋や工場のモックアップの中で数百ものマイクロタスクを撮影し、その後、同僚がフレームを機械が読める手順として注釈付けする。同社によれば、その成果物は、Amazonのような企業も含め、家庭用ロボットや倉庫システムを開発する米国のITクライアントに届けられる。このビジネスモデルは、人型ロボットやモバイルロボットを訓練するために、清潔で現実に即した行動データを大量に作り出すことに依存している。ゴールドマン・サックスは、ハードウェアコストが低下し、汎用のAIモデルの改善が続くことを前提に、人型ロボットに紐づく支出は2035年までに$38 billionを上回る可能性があると見込んでいる。
データ収集のやり方からプライバシーと賃金の公平性への懸念が浮上
キッチン、リビングルーム、工場のフロアで日々の活動を記録することは、プライバシーの問題を引き起こす。ベッドルームや家族の撮影を避ける労働者もおり、また、データの保管期間、ライセンス、そして追加の補償なしにその映像が将来の商用モデルで使われるのかどうかについて、明確なルールを求める人もいる。賃金の公平性も別の懸念だ。低コストの労働で訓練されたロボットが生むものと、米国で売られるプレミアム製品のギャップが、政策立案者や顧客から注目を集めている。高マージンのロボティクスを可能にするデータセットが、貢献者に対してより高い賃金を求めるべきかという問いは、配車サービスやコンテンツ・モデレーションをめぐる先行の議論と似ている。こうした問題があるにもかかわらず、米国のチームは、壊れやすいAIモデルを避けるために、多様な手、照明、環境を引き続き必要としており、その結果、映像への需要が維持されている。
よくある質問
タミル・ナードゥ州の労働者はAI学習のためにどんな作業を撮影するの?
労働者は、ヘッドバンド型カメラを使って、マンゴーを切る、靴ひもを結ぶ、コーヒーを淹れるといった日常の活動を撮影する。この映像は、同様の作業を行えるようにAI搭載ロボットを訓練するために使われる。
一人称動画の撮影で労働者はいくらもらうの?
労働者は、AIロボット開発のための学習データを供給する家庭や職場での作業を撮影して、1時間あたり約$2.40を稼ぐ。
このデータ収集からどんなプライバシー上の懸念が生じるの?
映像はしばしばキッチン、リビングルーム、工場のフロアから得られ、保管、ライセンス、そして継続的な労働者への補償なしに将来の商用モデルで使われるかどうかといった点が問題になる。ベッドルームや家族の撮影を避ける労働者もいる。