トクイテンメルマガ 第9号

深層学習の発展と特徴量抽出

「深層学習」や「ディープラーニング」といった言葉を聞いたことはあるでしょうか?元々は古くから研究されてきた脳の細胞に着想を得た「ニューラルネットワーク」を発展させて4層以上にしたために「ディープ」と呼ばれるようになったのですが、結果としてこれが現在「人工知能」といえばという代名詞になっています。人工知能の歴史を語ると長いのでやめますが、深層学習技術は画像認識に始まり音声認識や自然言語処理、画像生成、音声合成など様々な領域に広がっていて、当初からロボットへの応用も考えられてきました。
深層学習は機械学習の一つの形なので研究者としては殊更深層学習を推すのは気が引ける部分はあるのですが、確かにこれまで苦戦してきたパターン認識やパターン生成の分野で圧倒的な性能を叩き出してきました。深層学習ならではの発想があるとすれば、設計者が苦心して設計していた「特徴量」と呼ばれるような情報の特徴を取り出す方法を全て機械にまかせてしまおうという考え方です。機械学習といっても従来の多くの研究開発では、データに基づいて「学習」する部分と学習しやすいようにあらかじめ情報を加工する「特徴量抽出」という二つの部分に分けて設計し実装してきました。深層学習ではその両方をデータに基づいた「学習」で実現してしまおうというということなのです。
これにより、データの量が大幅に必要になった代わりに、人間の開発者がそれなりに考えて工夫する特徴量エンジニアリングから開放されることになりました。この特徴量は、本当に性能に寄与するかどうかわからないまま設計して、学習させてみて初めて性能が評価できるという類の試行錯誤の産物でした。面白いのは人間が苦心惨憺の末考え出した特徴量を機械による最適な特徴量の「設計」が圧倒的に凌駕してしまうことです。得意なことは得意なものに任せましょうということでしょうか。

「柔らかい判断」のできるロボットの実現

ロボットの活躍する場が広がると期待されている背景には技術的な進歩があります。ハードウェアの進歩もありますが、その秘密の一つは「柔らかい判断」のできる知能が深層学習により実現されてきていることです。上記の深層学習に基づくロボット動作生成もその一つです。
工場の中だけで規格化された部品を決まった場所から決まった場所へ摘んで移動したり、決まった経路をなぞりながら溶接をしたりといった動作は1980年代から一般化してきましたが、なかなか日常にロボットが出てこなかったのはこの「柔らかい判断」が難しいからでした。
 
最初にご紹介するビデオは、私の出身研究室のお隣の研究室、情報システム研究室(JSKという略称でも有名です)の教授である稲葉先生が博士課程の研究として行い1983年に発表した紐結びロボットです。このロボットは一本のアームとカメラからの画像情報を利用してロープの結び目を作ることができます。是非、再生ボタンを押して欲しいですが、この動作には10分の時間がかかったそうです。このような課題にいち早く取り組まれた慧眼は素晴らしいものがあります。
論文を読んでみますと、この手法では3次元の位置計測、ロープの位置の検出、ロボットの動作計画などが数式を使って丁寧に書いてあります。しかし、現代的な目からみると、この計算手法はさらに複雑な状況ではさらに複雑な計算が必要になることが前提で、それを全て人間が書き下してプログラムにすることは不可能に近いということが、この考え方の限界なのではないでしょうか。
昔の紐結びロボット(該当箇所から再生します)。2018年にドイツで開催されたロボットシンポジウムで、東京大学稲葉教授が紐結びロボットを実現した博士論文(1983年)についてご自身で紹介しています。この研究も私たちの紐結びロボット研究も制約をつけて実現していますが、その制約は時代とともに取り払われています。ただ、繰り返し動作で盲目的に行う紐結びでなく、人間が行う一般的な紐結びを工場や日常生活で行うロボットはいまだ実現していません。
最近、森と学生たちが発表した紐結びロボットはこの限界を越えようというものです。
まず、紐結びを行う動作をプログラムで作っておき何度か実行して、その際の画像やロボットの動作、ロボットの指が紐に触れたかどうかを知るための触覚センサの値を計測しておきます。この動作プログラムはあまり数学的モデルなどを考えずに紐結びができそうな動作を作り込んでいるのですが、この成功時のデータのみを使って深層学習のモデルを学習させるのです。この際、ロボットから得られるデータをそのまま入力として、その少し未来のデータを出力とするような「予測モデル」を作ります。この予想モデルの出力のうちロボットの動作情報(関節角度)をロボットで実現するようにプログラムします。すると元の作り込み動作プログラムよりずっと成功率が高く紐結びが実行できることがわかりました。
また、このモデルに学習していない色の紐を渡しても紐結び動作ができることがわかりました。作り込みのプログラムであれば、この変化した紐の特徴を再設計しなければならなかったはずです。この深層学習モデルがうまく紐結びに重要な特徴を抽出できたため、必要のない情報を無視して、適切な情報を適切に使うような「柔らかい判断」ができたのだと考えることができます。
蝶々結びをロボットが行います。
止め結びをロボットが行います。
 
1985年のつくば科学万博や2006年に愛知県で開催されたの愛・地球博のロボット展示をみて「あんなことができるんだ」「すぐそこにロボットのある便利な日常生活が実演するんだ」と胸躍らせた方も多かったと思いますが、それらの多くは「柔らかい判断」ができなかったにもかかわらず、設定した環境の条件に合わせたプログラムを作って、さもあらゆる状況でも動くというような錯覚を与えていたかもしれません。
トクイテンでは、農業のようなあらかじめ規格化された状況にも対応できるような「柔らかい判断」のできるロボットを開発していく予定です。同じ志を持つ仲間を待っています。
 

余談

この紐結びロボットは、元々は早稲田大学表現工学科尾形研究室3年生の学生プロジェクト演習の題材として、パトレイバーを参考に森が提案したものです。しかし当の学生たちが興味を示さず、当時修士1年生で学部3年生の指導係だった金村杏美さんが興味を持ち、博士課程の鈴木彼方さんと一緒に共同で実現したプロジェクトとなりました。以下の場面は主人公の和泉野明がレイバーと呼ばれる人型ロボットに乗り込んで、ロボットの手を使って大きなケーブルの蝶々結びをする場面なのです。私たちの研究は、この紐結び動作でレイバーが賢くなっていくとしたらどのようにすればよいだろうかと考えて、現在の技術で実現したものです。実は、漫画版とは枝分かれしたアニメ版パトレイバーのストーリーの終盤ではニューラルネットによりロボットが賢くなっていく新型レイバーが登場(放映は1990年!)しますが、これはまた別のお話。
「機動警察パトレイバー」愛蔵版第一巻214ページ
「機動警察パトレイバー」愛蔵版第一巻214ページ
「機動警察パトレイバー」愛蔵版第一巻213ページ
「機動警察パトレイバー」愛蔵版第一巻213ページ
 
「機動警察パトレイバー」愛蔵版第一巻216ページ
「機動警察パトレイバー」愛蔵版第一巻216ページ
「機動警察パトレイバー」愛蔵版第一巻215ページ
「機動警察パトレイバー」愛蔵版第一巻215ページ

参考文献

Hirochika Inoue, Masayuki Inaba : Hand Eye Coordination in Rope Handling, Robotics Research: The First International Symposium ,Vol. 1, pp.163-174, MIT Press, 1984
稲葉雅幸、井上博允「ロボットによる紐のハンドリング」日本ロボット学会学会誌、vol.3、No.6、1985
Kanata Suzuki, Momomi Kanamura, Yuki Suga, Hiroki Mori, and Tetsuya Ogata: In-air Knotting of Rope using Dual-Arm Robot based on Deep Learning, Proceedings of 2021 IEEE/RAS International Conference on Intelligent Robots and Systems (IROS 2021), 2021. SICE International Young Authors Award (SIYA-IROS2021)
金村杏美,鈴木彼方,菅佑樹,森裕紀,尾形哲也:双腕2指ロボットによる深層予測学習を用いた紐結び動作の実現,日本機械学会ロボティクスメカトロニクス講演会,1P3-D01, 2021年6月7日.