Facebookの人工知能研究チーム、写真に質問すると回答が得られる「ビジュアルQ&A 」を開発

SHARE:
上: Facebookの開発するビジュアルQ&Aのデモ動画 Image Credit: Screenshot
上: Facebookの開発するビジュアルQ&Aのデモ動画
Image Credit: Screenshot

Facebookの人工知能研究が着々と進んでいるようだ。最新のブログ投稿で、同社は人工知能研究の進捗を発表している。

研究チームの最新の成果として挙げられているのが、コンピュータビジョンによる物体認識と自然言語認識のエリアだ。物体認識に関しては、研究チームが開発した最新のシステムを用いれば、既存の大半のシステムよりも、写真の中の物体を識別する処理である「セグメンテーション」を30%速いスピードで、かつ10分の1のトレーニング用データで処理できるという。

また、自然言語認識に関しては、ディープラーニングシステムを動かす元となっているニューラルネットワークに短期記憶を追加した、記憶ネットワーク(MemNets)という新技術を開発し、その結果、より人間に近い形で言語が理解できるようになったと述べている。

そして、このコンピュータビジョンと自然言語認識の最新技術を結びつけて新たに開発されているのが、モバイルベースのシステム「ビジュアルQ&A」だ。写真についてユーザーが質問をすると、その回答が返ってくるものだ。以下はそのデモ動画になる。

Visual Question and Answering DemoEarlier this year, we showed some of our work on natural language understanding — specifically, a system called Memory Networks (MemNets) that can read and then answer questions about short texts. In this demo of a new system we call VQA, or visual Q&A, MemNets are combined with our image recognition technology, making it possible for people to ask the machine what’s in a photo.

Posted by Facebook Engineering on 2015年11月3日

Facebookの最高技術責任者Mike Schroepfer氏はブログで次のように述べている。

「視覚に何かしらの障害を抱えている世界の何百万の人々にとって、この成果がどのような意味をもつか考えてみてほしい。友人達がお互いに写真を共有しているときに、その経験から置いていかれることなく、参加できるようになる。この研究の開発はまだ初期段階だが、この技術が秘める可能性の大きさは確かだ」

このアプリはまだ開発段階であるものの、ユーザーが試しに使ってみたところを映す以下の動画はなかなか感動的だ。

Teaching machines to see and understandFacebook’s AI team is working to build smart systems that can enhance people’s lives. Watch this video to learn about how we’re approaching AI research and the impact this work is already having.

Posted by Facebook Engineering on 2015年11月3日

Facebookの人工知能研究の成果が形になり、何億という同社のユーザーにもたらされれば、ライフスタイルに与えるそのインパクトは非常に大きなものとなりそうだ。

----------[AD]----------