AI勉強会|GANやVAEが書けるようになりたい
アジェンダ
GAN 派と VAE 派の過激な言い争いを楽しむ場?かな?煽り愛だなぁ。 レベルが低次元なのに会話の内容が難しいだけに学者はこわい。
正直、何言ってるかわからないまんま記事にしてますので、いつも以上にトンチンカンなお話をします。 オウム返しのようなメモばっかりです。
開催概要
公式ページに今日のスライドが公開されています。 → 資料だけくれ枠まで、みたいです。パスワードを求められますので、管理者にお問い合わせください。
参加方法
抽選や承認はありませんので、好き勝手にお越しください。
オンラインコミュニティ
情報交換・質問・クレームなどはAI FASHIONのSlack(自由参加)でお願いします。
ビネクラの公式Twitterもよろしくお願いします(Twitter)
やること
画像生成系をいくつかおさらいし、実際にコードを書きます。ソースコードを配布しますので、初心者におすすめです。
★有志による雑多な報告や発表を募集中★
対象者
Python初心者・プログラム初心者を歓迎します(会場の皆様でサポートし合いましょう!)
持ち物
・ノートPC(2h分の充電)
内容(盛り沢山ですみません)
・生成系ってなに?
・AEとVAEの説明
・AEの実装(お寿司の生成とモーフィング)
・(休憩)雑談「GANでこんなビジネス考えたんですけどどうですか?」
・GANの説明
・DCGANの実装(お寿司の生成とモーフィング)
・応用編:pix2pixの実装(調整中です)
+有志による雑多な報告や発表
縛りプレイ:数式を使わない。 おかげでアレルギーを発症しなかったです。ありがとう!
座学:VAE の部
もう正直何を言ってるか分からないが、掛け合いが楽しかったのでアレルギーを発症しなかったです。1
生成モデルの考え方と実例
Word2Vec のような考え方をすることもできる しかし、非常に分かりやすい2解説だ…。
分布(類似パターン)を作ってはずれ値を検出するため、でないと正常性が分からないから、だと思う…。
オートエンコーダーの話と、データの分布
- 教師なしデータ
- 入力(エンコーダー)と出力(デコーダー)が同じ結果になることが期待される
- Encoder, Decoder の理屈的な(数式のある)話、可逆だよ
オートエンコーダーといっても、さまざまな種類があり、ここでは pix2pix を例を取り上げています。 どれが良いか、ではなく
ニセ札を作る側・見破る側のイタチごっこ
これが画像の精度を上げる良いアプローチで、常に見破る側を優勢にしておかないと破る側がサボり始める。 この辺りは人間的というか、すごい納得しますね。 正しいと判定したものに合わせて学習するので、正しいという判定基準自体を変えなければならないが、正しいものは変えてはならないというものです。
正しいものを変えるというのは、たとえば「1 万円札が福沢諭吉から渋沢栄一に変わったぞ」レベルのお話ですね。 これぐらいやらないと、ニセ札業者は常に福沢諭吉を書き続けますよ、という話です。
pix2pix のガチな話
実装とアプローチ、考え方の話。 今回のパターンについて、ということですがしっかりと数式のお話をされたので一気にポカーンと…
小ネタ、というガチトーク
MakeGirlsMoe、一時期大流行したやつですね。。 やっていくと分かりますが何度も実行していくと学習している様子が分かります。 生成したものが良ければ Good、そうでなければ Bad を入れてあげてください。 どの程度 Good か、どの程度 Bad かという情報が分かれば、もっと精度を上げられそうな気がしますね。
ためしに、桃色・ショートヘア・メガネ・開口3でやってみた結果です。 一番最後の娘がおぢさん的には激アツです、ガチャ回してる気分なので思わず「神引きした!」と叫んでしまいました。 案の定、この後何回か生成したんですが、これを超える画像は引けなかったです…。
長い時間見てると不安定になって精神に支障をきたしかねないので程々にしましょう。 あえてやべーやつをここに貼り付けています。 メガネを誤認識しているのか、目のサイズが小さくなる傾向にあるような気がしますね。 あとは正面とか横顔、アオリ・フカンなどなど、設定するパラメーターがイジれると良さそうです。
オチ
萌えイラストの評価軸を持つ専門家の方向け情報ですが、Good, Bad をつけていくと「このシステムに合わせてユーザーの評価基準が決まる」なぁと自覚するタイミングが出てきます。 自分の趣味というか、譲れないポイントを探してみてください。
ここの新しいプロジェクトが激アツですね!!!
所感
結局分からなかった。 が、実務で AI をガチャガチャいじって研究している人の日常を垣間見る事ができた、と思えば非常に有意義な時間でした。 めちゃくちゃ頭を使う話だったのでお腹が空きますよこれは…!
AI を使いこなすのは簡単なお話ではない、というのを改めて感じました。