モノのインターネット（IoT）のように、今度は目のインターネット（Internet of Eyes）の時代が到来する

Image Credit：Tunnel vision / lattefarsan on Flickr

Ken Weiner氏は画像内広告プラットフォームGumGumのCTOを務めている。

数週間前、ニューヨークでLDVビジョンサミットが開催された。主要テーマはコンピュータビジョンの応用がなされる可能性のある分野。

3D画像処理、VRからディープラーニング、Facebook Live（私自身、AR広告についてプレゼンをしたほど）などあらゆる分野にわたり、全てのクリエイター、エンジニア、マーケター、投資家は今後この分野を注視しなくてはならないという結論に達した。以下にその理由を5つ述べよう。

モノのインターネット（IoT）のように、今度は目のインターネット（Internet of Eyes）の時代が到来する

LDVサミットの創設者であるEvan Nisselson氏が数週間前に同サミットの冒頭スピーチで示してくれたように、コネクテッドカメラやビジュアルセンサーがあらゆる場所で普及し、あらゆるモノに組み込まれている。

リアルタイムにビッグデータに接続できることとユビキタスな視覚情報の記録が組み合わさって、人の動きに合わせてエネルギーの設定を変えられるようなスマートな建物が生まれている。

さらには、例えばあなたの体重がどれくらい増えたかとか、どれくらいのアルコールを飲んだかを伝えてくれる、3Dスキャナーやアルコールセンサー内蔵の鏡といったものも登場するかもしれない。

もちろん、そのようなことが実現すれば、コンテキストに基づいた「ミラー内」広告が入浴中のあなたに低カロリー食品やアスピリンを勧め、その場で購入することができ、さらに数分で配達されるようになるだろう。

コンピュータビジョンは現在私たちが目にしている以上のものになる

この業界にいる人なら画像認識をご存知だろう。これはコンピュータが画像を複数のピクセルに分割し、その中にあるものを「見る」ためにパターンを認識するプロセスだ。

しかしこれだけがコンピュータビジョンになっていくわけではない。コンピュータビジョンとは、ビッグデータへのリアルタイムのアクセス、ジオロケーション、センサー、超音波のほか、ガスや熱といった人間には見えないがコンピュータには「見える」熱画像など様々なビジョンがあって成立するものだ。

コンピュータビジョンの可能性は、私たち人間が見えるものをすばやく特定するために大量の画像を処理するという点を超えている。もはや、人間が見ることができないものをテーマにしているのだ。

Image Credit ;Google Glass Photoshoot 27214 / taedc on Flickr

拡張メモリ（次世代Google Glassのようなタイプのデバイスを通して眺めると、すぐに相手の名前とその人に関連する情報を把握する）から「見える」ガス漏れに至るまで、コンピュータビジョンによってリアルタイムの超人的な近くが複数のチャネルから可能となるだろう。

とはいえ、現状はまだその段階には至っていない。

コーネル大学工学部のコンピュータビジョン学教授Serge Belongie氏はこの状態を、「最先端のコンピュータビジョンについて言うと、ある画像に関して未知のことについては語っていません。絵の中にバナナがあります、自転車がありますということしか言っていないのです」と表現している。

確かに。それでも相当の進歩だが、コンピュータビジョンにできることはまだたくさんあり、将来は画像からさらなる情報を抽出してくれるようになるだろう。

訓練データが十分得られなければ立ち往生してしまう

ディープラーニングの神経ネットワーク、廉価で速くなったコンピュータのパワーのおかげで実現可能となった画像認識の進化と機能によって、世の中の仕組みが変わってしまった。

しかしこうした聡明なアルゴリズムも、訓練がなされる画像データの一群にアクセスできなければ無に帰してしまう。医療画像から顔情報に至るまで、訓練データとして使用できる多数の画像はGoogleとFacebookの大手2社に独占的に利用されている。

両社の消費者向けプラットフォームで行われているシェアとアップロードの数を考えると、このトレンドが落ち着く気配はない。Greylock PartnersのJosh Elman氏がステージ上でのインタビューで話してくれたように、もしこの2社が訓練データを独り占めするのなら、コンピュータビジョンにとって障害となる可能性がある。

VRとARにはコンピュータビジョンが必要

仮想現実（VR）と拡張現実（AR）は目下のところ過大宣伝されており、こうした技術に注がれるコンピュータビジョンの取り組みはエネルギーの無駄使いだと考えている人がいる。

しかし私が話をしたほとんどの人は、VRとARはともに長期的な視野の中で存在しており、しかも進化していくためには高品質のコンピュータビジョンの機能が必要だと考えている（VRの「インタラクティブな」形態を改善させるための画像認識の活用など）。

多くの人は、今日のVRを1990年代半ばのインターネットに例えている。VRはまだ主流、マネタイズされる現象にはなっていないが、標準サービスとして採用される可能性を秘めているという。

コンピュータビジョンがさらに進化すれば、その機能によってますますVRとARに人々の関心が惹きつけられ、マネタイズがより現実的になるだろう。結局のところ、間違った場所に間違ったネジを使用していると教えてくれるような正確なコンピュータビジョンなしでは、IKEAの棚を組み立てるAR説明書など存在しないということだ。

コンピュータビジョンはすでに私たちの安全を向上させている

ディープラーニングとAI以外で最近のテック業界の大きなトレンドと言えば、それはロボティクスだろう。そう、ほとんどのロボットは執事サービスから組み立てラインの検査に至るまで、あらゆる作業をこなすためにコンピュータビジョンを必要としている（そして、必要とするだろう）。

たとえばNanotronicsは、人間が行うよりも速いスピードでしかも正確に、コンピュータメモリのウェハーの機能不全を検知するのに画像認識を利用している。

しかし中小企業や消費者からすると、人に危害を与えないようにプログラムされたコンピュータビジョンを使ったCarbon Robotics製のロボットアームKatia（価格は5,000米ドル以下）によってロボット技術によるサポートが現実のものとなろうとしている（ロボットアームによる事故など笑うに笑えない）。

同社によると、5,000ドルという金額はロボットアームが主流技術となるかどうかの分岐点なのだという。Carbon RoboticsがLDVのビジネスチャレンジDay 2で勝利したのはおそらくそれが要因だと思われる。

LDVビジョンサミットでは、コンピュータビジョンは今はまだ初期段階にあるが、ビジネスのレベルでもさらに広い社会的なレベルでも、明るい未来が待っていることが認識できた。また、若いエンジニアがこのエキサイティングで世の中を変えるような業界に参画するチャンスがますます広まっていることも期待できる。

【via VentureBeat】 @VentureBeat
【原文】