画像生成AIと人間が考えるということ
こんにちは、豊吉です。数週間前からAI界隈ではAIによる絵の生成が大変な話題になっていますがご存じでしょうか。複数の団体が、与えられた文をもとに自動で絵を描くAIをサービスとして公開したり、中には自由に使えるように配布し始めました。
話題になっている理由は、AIが誰でも使えるようになったことと、絵の精度が非常に高いということです。例えばこのURL(https://www.midjourney.com/showcase/)ではMidjourneyというサービスで生成された画像が公開されています。
![Midjourneyで生成された画像](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/tokuiten/b7dbeb02-b6ba-4109-b1d2-a4fd9a5958cb/8f7a62069a31219e7f191a3a9f1609f8.png)
どう感じるでしょうか?こういう人間が描いたような画像が誰でもどれだけでも生成できるようになってしまったのです。
私も早速試してみました。例えば「a blueprint of tomato harvesting robot」(トマト収穫ロボットの設計図)という命令を渡して出てきたのが次の一枚です
![](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/tokuiten/22f207af-120d-4539-8061-a206afcfbc9a/612c240e10f664f8f396ab6555c0b7a7.png)
ちゃんとトマトを収穫してる風のロボットが出てきました。そもそも言った通りの絵が出てきたことがすごいのですが、もっとすごいのはロボットの形状が見たことのないようなものだったということです。このままでは動かなそうですが、ネットでトマトを受けるというのは参考になります。
僕らは今必死にロボットの形状や構造を考えたりしていますが、このAIに何百枚も生成させてヒントをもらってもいいかもしれません。さらに6枚出力してみました。
![](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/tokuiten/c40d4733-a5e9-4ee5-aa88-6c890c9e5540/2ba31595565531ac4f98f57dab1f5e43.png)
全然違う形状のものが出てきました。ここにも何かヒントがありそうです。
こういったAIの登場によってまず大変になるのはちょっとした挿絵や風景画を描くような仕事でしょう。カメラの登場によって肖像画を描く仕事が減ったようなことの延長です。しかしここまでこのAIの登場が話題になっているのはこのAIから単に絵の仕事が奪われること以上を想像させられるからかなと私は思っています。
![「日本の若いトマト農家」を描かせたもの。写真に見える。](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/tokuiten/58dcbad9-3571-49ad-98e2-ba78216bf5ae/fb5d4ce0c83a783e59c7467bddf46711.png)
このAIがやっているのは単純化して説明すると、膨大な量の写真や絵を組み合わせて新しい画像を生成しているというだけです。しかし、私はこれは人間の脳がやってることと同じなんじゃないかという気がします。
つまり、画像を組み合わせるというのは人間の”新しいものを発想する”ということの本質で、それがAIができるようになっちゃったんじゃないの?これって知性に近いんじゃないの?という恐怖が湧いてくるのです。
例えば「大きな大根を入れた新しいカレーを作ってみてください」と言われたとします。頭の中で、大根がサイコロ状にゴロゴロと入っていたり、そのまま1本丸々とブッ刺さったりしたカレーの画像を思いうかべませんでしたか?
![「big daikon in the curry rice」で生成](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/tokuiten/bd691319-5032-46fc-b058-bb0b3727ef99/46b803608e5c87e38cdfa45bd65b2d5a.png)
![](https://s3.ap-northeast-1.amazonaws.com/wraptas-prod/tokuiten/9ac54cc8-ad62-48c0-85ef-1b48a6f73856/e3d969965ae9de3f366744927416b931.png)
それが上図のようにAIでできるようになりました。ちなみに私は上の「大根がサイコロ状にゴロゴロと入っていたり、そのまま1本丸々とブッ刺さったりしたカレーの画像を思いうかべませんでしたか?」を書いてからAIに画像を生成させました。私の考えはAIにもできるのです。
今は絵を描くことしかできませんが、この延長にはあらゆる新しいものの形(髪型、料理、建築、家具)が作れるし、図に落とし込めるならビジネスロジックや数式なども作れるようになるかもしれません。
なんと人類はもう新しいものを考える必要はないのです。やった!考えなくていい!
そこで私はもう人類のクリエイティビティは用済みかと思ったのですが、希望となるエピソードを思い出しました。私の好きな将棋の話です。将棋の藤井聡太さんは将棋の手を考える時に、他のプロやアマチュアがするように頭の中に盤面を思い描いて動かすということをしないそうです。どうしているかというと1六歩のような符号を頭に流し込んで検討しているということです。(インタビュー記事)
私の想像だと、普通の人は符号からコマの動きを考えその後画像化しているのですが、藤井聡太さんは画像を作るところを省略してコマの動きだけ検討して、画像生成という無駄な処理を省き高速化してるのでしょう。
というわけで、私たちも何らかの方法で頭に画像を思い浮かべない思考法を訓練することで、違う領域でまだまだ活躍できるかもしれません。自転車に乗るときにいちいち足の動きや左右のバランスのことを考えてないとかそういう感じでしょうか?藤井聡太さんなら説明できるかもしれませんが・・・
この辺りは当然私より共同創業者の森さんの方が専門ですので詳しく議論できたらなと思います。
今回は画像生成AIの話で終わってしまいました。引き続き農場長を大募集しておりますので、ご検討、シェアよろしくお願いします。人類として一緒に頑張りましょう!