株式会社東芝は、深層学習を用い、複数の吸着パッドを持つロボットハンドがピッキングする対象物の形状や姿勢に合わせて掴む位置と掴み方(以下、把持計画)を計算するAI技術を開発した。
「把持計画」は、ロボットが物体を正確に掴むための「位置推定」と「姿勢推定」から計算される。今回開発されたAIにより、ピッキングロボットは、正確な把持計画を計算することで効率的かつ確実に物体を取り扱うことができ、従来自動化が難しかった、乱雑に置かれた、形状や外観の異なる物品のピッキング作業を自動化することが可能となる。
今回開発されたAIは、深層学習を用いることで、技術者によるプログラミングが不要で、複数の吸着パッドを持つハンドが対象物の形状に合わせて把持する動作を正確かつ高速に計算することができる。
4つの吸着パッドを持つハンドを用いており、それぞれの吸着パッドを個別に制御することが可能だ。吸着パッドをいくつ使うか、またどれを使うかといった計算を対象物のサイズや形状に合わせて行うことができる。
従来手法では、対象物を画像として写し、吸着パッドの吸着候補位置を推定する計算を繰り返し行い、その中からベストな把持位置を決定していたため、吸着位置の計算に時間がかかっていた。
そこで今回開発された手法では、ハンドが対象物に接触できる面を検出する1段目のモデルと、検出した面の法線方向に基づいて射影変換させた画像からハンドの向きと吸着位置を決定する2段目のモデルで構成されている。
1段目のモデルで出力される情報(特徴マップ)を2段目のモデルの計算にも活用することで、繰り返しの計算が不要となる。
これにより、一回で把持可能な吸着位置を特定することが可能となり、計算時間を短縮することに成功した。
また、従来技術では対象物が密集している場合に精度が低下する傾向があったが、対象物の傾きに合わせたハンド姿勢の正確な学習を実現し、物体の向きがバラバラで乱雑に置かれていても把持することができるようになった。
なお東芝は、このAIに実際のロボットに搭載したカメラから取得した画像約4千枚を事前学習させ、272枚の画像を対象に把持位置の計算時間と精度を検証・評価したところ、同様の先行研究例の計算時間5.62秒、成功率73.9%と比較し、計算時間は0.47秒と10分の1以下、成功率は80.1%と6.2%向上した。
また、同AIを実機ロボットに適用したところ、94.5%の平均成功率で対象物を把持することができ、実用化レベルであることが確認された。
これにより、封筒や書類などの平面の物品から、各種サイズの箱や円筒容器、チューブ容器やブリスターパックなどの高さや奥行、凹凸のある物品など、形状や外観の異なる多種多様な物品をロボットで高速かつ正確に自動でピッキングすることができるようになる。
なお、この技術の詳細は、10月14日から18日にかけてアブダビ首長国で開催されるロボティクス分野の国際学会「IROS(IEEE/RSJ International Conference on Intelligent Robots and Systems)2024」にて発表される。
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。