写真ストックのShutterstockもマシーンラーニングを活用、高精度のリバースイメージ検索を開発中

SHARE:
上: Shutterstock Image Credit: Paul Sawers / VentureBeat
上: Shutterstock
Image Credit: Paul Sawers / VentureBeat

写真ストックの大手Shutterstockは、新しいコンピュータビジョン検索をプラットフォームに導入し、同社のAIの威力を見せつけている。

ニューヨークのエンパイアステートビルに本社を置く同社は、2012年に株式公開し、現在では7,000万以上の画像をブロガーやメディア向けに提供しており、その数量ゆえ、特定のものを検索するのが難しくなることがある。

もちろん、実績のある昔ながらのキーワード検索ツールはある程度有効だ。だが、もし自分が持っている画像と似たものを探したい時はどうすればよいだろう? または、色合い、雰囲気、形が似ている別の画像が欲しい時には? こんな時、Shutterstockの新しいリバースイメージ検索が威力を発揮してくれる。

コンピュータビジョンとは基本的に、画像をピクセル(画素)単位まで分解・処理することで、コンピュータに画像を分析・理解させる人工知能の研究分野であり、キーワードや説明によるメタデータ(人間が作成せねばならず、その正確さにも依存する)とは異なっている。Shutterstockは1年以上前からコンピュータビジョンのチームを立ち上げており、今回の検索機能はその最初の成果だ。

Shutterstockのメイン検索ボックスでは現在、画像のアップロードやドラッグ&ドロップに対応している。

上: Shutterstock: 写真のアップロード
上: Shutterstock: 写真のアップロード

PCから任意の画像を選択すると…

上: Arch of Triumph: Palmyra Image Credit: Paul Sawers
上: Arch of Triumph: Palmyra
Image Credit: Paul Sawers

…Shutterstockは、マッチする画像を検出すべく、画像データの分析を開始する。

上: 検索中…
上: 検索中…

そして最終的にまとめて表示されるのは、内容だけでなく、見た目や雰囲気がオリジナルの写真に似た画像の集まりである。

上:結果
上:結果

もちろん、このコンセプト自体に目新しいものは何もない。リバースイメージ検索は、SnaplayImageBriefTinEyeなど無数のサービスで各方面から利用されており、また、最大手Googleも使いやすいリバースイメージ検索ツールを提供している。

上:Googleのリバース画像検索
上:Googleのリバース画像検索

しかし、先進技術をそのまま生かしたサービスから始めたこれらの企業はマシンラーニングの領域に深く入り込み、人間にとってより便利なリコメンド機能を実装しようとしている。

予測入力キーボードの企業SwiftKeyは先日Microsoftに買収された。それはAndroidやiPhone向けの人気アプリを持っているからではなく、同社が人工知能とマシンラーニングをベースとした高度なバックエンドを構築しているからである。これには、人間の脳により近い構造や動作を持つ人工ニューラルネットワーク(ANN)も含まれている

これと同様、Shutterstockは同社のリバースイメージ技術のために、独自の畳み込みニューラルネットワークを開発し、これはまた、検索結果の最下部に表示される「類似画像」オプションの改善にも用いられている。

例えばこのスクリーンショットでは、イングリッシュブルドッグの写真の下に、従来のキーワードベースの「類似画像」オプションが表示されている。いくつかは確かにブルドッグだが、犬であるだけの写真もあり、一部はおかしな写真もある。ウィッグをかぶった犬は可愛いだろうが、使い物になる写真だろうか? 書く必要はないだろう…

上:見た目は似ているか?
上:見た目は似ているか?

新しい類似画像は視覚的にも似ており、オリジナルと正確にマッチしているとは必ずしも言えないが、以前より似てきている。

上:見た目は似ている
上:見た目は似ている

Shutterstockは豊富な写真のストックでよく知られているが、同社はまた多数のビデオクリップを所有しており、この視覚的な類似検索機能をまもなくビデオにも拡張する予定である。

「Shutterstockほどの膨大な画像コレクションを持っているのであれば、アドバンストサーチ(詳細検索)やディスカバリーツール(発見のためのツール)で顧客のニーズに完全にマッチする素材を見つけられることが、当社の継続的な成功のためには最も重要です」とShutterstockの設立者兼CEOのJon Oringer氏は述べる。

「ビデオでそれができればブレークスルーものですが、この技術が画像やビデオクリップに何が含まれるかの学習と認識を続ける限り、可能性は高まっていきます。私たちは、顧客をよりよく理解し良質なサービスを提供するために、ディープラーニングを使いこなす糸口をつかんだに過ぎないのです。」

エンタープライズソフトウェア薬の検索から、予測タイピングから今回の写真ストックの検索まで、マシンラーニングは今や、抽象的な研究分野というよりは現実に近いものになっている。コンピュータがついには囲碁で人間に勝つ日まで、そう遠くはないだろう…ちょっと待って、こちらを見るとますます現実味を帯びている。

【via VentureBeat】 @VentureBeat
【原文】

BRIDGE Members

BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。
  • 会員限定記事・毎月3本
  • コミュニティDiscord招待
無料メンバー登録