Facebookは35億枚のインスタ画像とハッシュタグで画像認識AIを強化ーー85%以上の認識率、2万カテゴリを対象

SHARE:

facebook-f8-2018-recognition-accuracy.png

Facebookは今日(原文掲載日は5月2日)、35億枚にも及ぶInstagramの共有写真とそれらに付けられたハッシュタグを使って、コンピューターシステムが新しい進歩を遂げたことを明らかにした。

よく利用されているベンチマークデータセットである「ImageNet」で85.4%という高い画像認識率を叩き出したもので、この人工知能(AI)モデルは世界最高の画像認識システムとなっていると機械学習担当のFacebookディレクター、Srinivas Narayanan氏は胸を張る。

これはカリフォルニア州サンノゼにあるMcEneryコンベンションセンターで開催されたFacebookの年次デベロッパーカンファレンスであるF8のステージ上で発表されたものだ。今年のF8で発表された他のニュースには、Oculus Goのリリース、新しいFacebook Storiesの共有機能、Cambridge Analyticaのスキャンダルに関するアプリやボットの再検証などなど盛りだくさんだった。全レポートはここを確認してほしい。

さて、このFacebookの調査結果は、現実世界のコンピュータビジョンがより特定の詳細を「見る」ことができることを指し示している。単に「食べ物」と言うのではなくインド料理やイタリア料理を認識し、「鳥」だけでなく、それがヒメレンジャクであること、「白いスーツの男」だけでなく、彼がピエロであることを認識してくれる。

Facebookのコンピュータビジョンの改善により、古い思い出を共有することからNews Feedのランキングに至るまで、あらゆる面でより良い体験ができるようになると、Facebookの機械学習部門でコンピュータービジョンリサーチ統括を務めるManohar Paluri氏は本誌に語ってくれた。

「この技術は目の不自由な方向けのキャプション、ビジュアル検索、プラットフォームポリシーの遵守に活用が可能なものです。より豊かで、以前よりもはるかに詳細な世界を理解した表現ができるので、個々のタスクではるかに優れた仕事ができるようになります」。

Facebookのコンピュータビジョンの進歩の大部分は「教師あり学習(※翻訳者注:機械学習の一種)」によって成し遂げられたとPaluri氏は語る。これまでは人手がニューラルネットに提供されたデータのラベル付けに関与していた。しかし今日の進歩は、ラベル付きと「ラベルが付いていない」データセットを組み合わせたものになっており、教師あり学習の影響は弱められつつあるという説明だった。

これまでよくわからなかったハッシュタグは、有名な英語データベース「WordNet」とハッシュタグを相互参照することによって識別することに成功している。Paluri氏はその紐付けについてこう続けた。

「WordNetにある言葉は現実世界の物体や現実のものに基づいているため、ハッシュタグとWordNetにある言葉との共通部分を取り出して、交差するツリーの部分を修正し、トレーニング用のハッシュタグとデータのみを使用しました。これらのハッシュタグはトレーニングのために関連付けられており、これが実際により説得力のある表現を実際に学ぶことにつながりました」。

Facebookは教師あり学習よりもより人手を少なくする手法でAIを学習させるため、このより弱めの教師あり学習という手法を使うようになったそうだ。

また、この弱めの教師あり学習が採用された背景のもうひとつの理由として、ハッシュタグデータのノイズの多さも挙げられる。例えば写真にエッフェル塔が写ってなくとも、それが近所にあるという理由でワンちゃんに「Eiffel Tower」というハッシュタグを付けてしまうことがあるのだ。

今回の研究で特定分野の深堀りは特になかったが、このAIモデルは既に2万カテゴリのイメージを認識できるそうだ。これらはFacebookにある鳥や花、ペットといった画像の深い認識に利用されることになる。近い将来、同社はこのカテゴリを10万にまで拡大させるという。

「食事は特に改善したいと考えている特定分野になります。その他もまだ全てをリストできているわけではありませんが、すぐにでも次のステップで取り組みたいものはありますね」。

またPaluri氏は関連研究で、動画についてもマルチラベルデータセットや弱めの教師あり学習に取り組むことで、似たような技術が適用できるかもしれないと語っていた。

【原文】

【via VentureBeat】 @VentureBeat

----------[AD]----------