2019年5月27日 – 世界37カ国のデータサイエンティストに支持されているDeep Learning向けGPUクラウド”GPU EATER”を開発する米国スタートアップPegara, Inc.(読み:ペガラインク、本社:米国デラウェア州、創業者兼CEO:市原 俊亮)の子会社ペガラジャパン合同会社(本社:千葉県浦安市、代表執行社員:市原 俊亮)は、2019年6月4日(火)~6月7日(金)にて朱鷺メッセ 新潟コンベンションセンターで開催される予定の「2019年度 人工知能学会 全国大会 (第33回)」の企業スポンサーブースにおいて、最新のDeep Learning手法を用いたデモ展示を行います。
誰でも自分の顔がアニメ顔や異性の顔に変換
当社ブースではCycleGANを使い、カメラに映った人間の顔をリアルタイムにアニメーション風の顔や女性の顔へ変換するデモンストレーションを展示します。
今回のデモンストレーションは米AMD社製Radeon™ RX Vegaシリーズと同社製のROCmと呼ばれるライブラリを用いて、Deep Learningの最新手法の1つである“CycleGAN”と呼ばれるニューラルネットワークの検証過程で生み出されたものとなります。今年3月に開催されたイベントで披露した際、参加者らによる評価が高かったため、今回より多くの方へ楽しんで頂きたくデモ展示を行います。
アニメ顔変換は10エポック程度が最適か
“CycleGAN”は2つのドメイン間でデータを学習するドメイン変換技術で、ドメインAのデータをドメインBへ変換し、ドメインBのデータをドメインAへ変換し、回転(Cycle)させるようにフェイク判定を行い学習することが特徴のDeep Learning手法です。
アニメのような元画像とドメインが離れたものを実際に学習すると画像が崩れてしまうことが多く、調整が難しくなります。
今回、学習に使用した枚数はドメインA10000枚、ドメインB10000枚の計20000枚。左から、元画像、10エポック(weak)、50エポック(normal)、200エポック(strong)と右に行くほど強い変換結果が得られています。しかし、強ければ強いほど画像は破壊され、元画像が認識できない状態になります。200エポックまでに要した時間はGeForceRTX2080TiまたはRadeonVIIで10時間前後ですが、顔として認識できたのは10エポック程度のものでした。