トクイテンメルマガ 第12号
今回は森が物体検出と農業AIの関係についてお伝えします。
物体認識と物体検出
「パターン認識」という技術は、入力されるデータに関する「パターン」に応じて機械が判断を行うコンピュータのプログラムです。パターン認識はデータから「学習」して判断する「機械学習」の研究分野として発展してきました。
近年の深層学習技術が注目を浴びたきっかけは画像のパターン認識の圧倒的な性能だったのですが、これを利用した様々な応用が出てきました。例えば、転落を防ぐための駅のプラットホームでの人の認識などの安全のための応用、超音波検査画像からの心疾患の検出などの医学応用、中には顔画像から遺伝子疾患を判別する研究なども発表され、思いがけない応用が様々に出てきています。
ここで、「認識」と「検出」という単語が説明なく出てきましたが、技術用語としては異なるものになっています。認識は、画像の中にとにかく何があるかを判断する技術で、検出ではそれに加えて「何が」「何処に」あるかを判断する技術です。画像検出では、認識した物体のある場所を四角い領域で囲って提示します。
農業AIと物体検出
最近のロボットを使ったベンチャー企業のプロモーションビデオでよく出てくるのは物体検出かもしれません。ロボットから見た画像に写ったトマトやピーマンを四角で囲っているものです。この技術を使って収穫対象の果実の場所がわかればロボットアームで刈り取ってしまうという算段です。
この物体検出技術は我々も検証していて、ご協力いただいているトマト農家で検証実験を行いました。我々が行ったのはオープンソースの物体検出のモデルをインターネットからダウンロードして、我々が撮影したトマトの写真から「赤トマト」と「緑トマト」の場所をひたすら四角で囲い続ける「アノテーション」し、この訓練データを使ってモデルを訓練することでした。
アノテーション作業は、最近はお金を払ってクラウドソーシングサービスを使って多くの方々にご協力をいただくのが主流ですが、お金がない私は自分でせっせとアノテーションを行って、モデルの訓練を行いました。以下のビデオを見るとわかりますが、多くのトマトの検出に成功しているのがわかります。
物体検出の技術自体は様々な手法がありますが、このときに利用したモデルはYOLOv5と呼ばれるモデルでした。このモデルはオープンソースとして公開され誰でも使用することができます。
YOLOはYou only look onceの略で開発コードのようなものです。もともとはJosephRedmonにより開発・公開されていましたがバージョン3を公開した後、AlexeyBochkovskiyに開発を引き継ぎました。AlexeyBochkovskiyは研究を進めてYOLOv4を公開しましたが、この直後に突然YOLOv5と呼ばれるモデルを匿名の開発者が公開して、性能の高さを見せました。その後、開発者はYOLOv4にも参加したGlenn JocherとわかりましたがYOLOv4とYOLOv5の間に直接の関係はなく、関係者を戸惑わせたものです。深層学習モデルの名前は凝った名前が多く、たまに全く内容の異なる同じ名前のモデルが別のグループから発表されたりするのですが、この名前被りは意図的です。あまり行儀の良い行為ではないかもしれません。
最近では、深層学習技術を試すためのプログラムなどを安価に活用することができます。あまり限定することなく、様々な技術を使っていこうと考えています。