Meta、「GPT-4V」に匹敵するマルチモーダルAIをレイバンのスマートグラスでテスト開始

SHARE:
Image credit: Ray Ban

Facebook、Instagram、WhatsApp、Oculus VR の親会社 Meta Platforms からのニュースだ。新音声クローン AI「Audiobox」のリリースに続き、同社は今週、アイウェアの代表的企業 Ray Ban との提携により、Ray Ban Meta スマートグラス上で動作するように設計された新しいマルチモーダル AI の小規模なトライアルをアメリカで開始すると発表した。

この新しい Meta マルチモーダル AI は、2024年に一般公開される予定だと、長年フェイスブックで Meta の CTO を務めてきた Andrew Bosworth 氏(通称〝Boz〟)が Instagram に投稿した動画が伝えている。

来年、私たちは、あなたが質問したことだけでなく、あなたの周りの世界についての情報を与えるために、スマートグラスのカメラを活用する AI アシスタントのマルチモーダルバージョンを発売する予定です。そして、今週から、このマルチモーダルAIを米国で早期アクセスプログラムを通じてベータテストすることになり、とても興奮しています。(Bosworth 氏)

Bosworth 氏の投稿には、プログラムへの参加方法は含まれていない。

9月にパロアルトで開催された Meta の年次カンファレンス「Connect」で発表された最新バージョンのスマートグラスは、エントリー価格で299米ドルで、すでに AI アシスタントを内蔵した現行モデルが出荷されている。それでもかなり限定的で、動画や写真にインテリジェントに反応することはできず、ましてや(スマートグラスにはカメラが内蔵されているにもかかわらず)装着者が見ているものをライブビューで見ることはできない。

その代わり、このアシスタントは音声で操作できるように設計されており、具体的には、Amazon の「Alexa」や Apple の「Siri」に似た音声アシスタントのように、装着者が話しかけるようになっている。

Bosworth 氏は自身の Instagram の投稿で、マルチモーダルバージョンの新機能のひとつを紹介した。そのなかには、スマートグラスをかけ、オフィスのカリフォルニア州を示すウォールアートの照明を見つめるビデオクリップも含まれている。興味深いことに、彼はスマートフォンも手にしているようで、AI が機能するためにはスマートグラスとペアリングされたスマートフォンが必要であることを示唆している。

新しい Meta マルチモーダル AI の見かけのユーザインターフェース(UI)を示す画面では、Bosworth 氏の「見て、何が見えるか教えて」という質問に見事に答え、そのアートを「木彫りの彫刻」と識別し、それを「美しい」と言った。

Meta のマルチモーダル AI のベータ版を示す動画
Image credit: Bosworth 氏の Instagram

Meta の製品やプラットフォーム全体が AI を全面的に受け入れていることや、同社の特徴である大規模言語モデル(LLM)「Llama 2」を通じてオープンソース AI を推進していることを考えれば、この動きは予想されたことかもしれない。しかし、マルチモーダル AI への初の試みが、web 上のオープンソースモデルという形ではなく、デバイスを通じて行われたことは興味深い。

OpenAI の「GPT-4V」を実行する「Ai Pin」の開発元 Humane をはじめ、いくつかの小規模スタートアップが、専用の AI デバイスで最初の試みを行っている。

一方、OpenAI は独自のマルチモーダル AI である GPT-4V(「V」は「Vision」を意味する)を iOS と Android 向けのChatGPT アプリを通じて提供する路線を追求しているが、このモデルへのアクセスには Chat GPT Plus(月額20米ドル)または Enterprise サブスクリプション(変動価格制)が必要だ。

この動きは、2010年代に Google が行った「Google Glass」の不運な試験も思い起こさせる。Google Glass は初期のスマートグラスのプロトタイプで、発売前に大々的な宣伝が行われたにもかかわらず、そのファッションセンス(またはその欠如)と、目に見えるアーリーアダプター層(「Glassholes」という言葉が生まれた)で嘲笑され、実用的な使用例も限られていた。

Meta の Ray Ban Meta スマートグラス用の新しいマルチモーダル AI は、Glasshole の罠を避けることができるのだろうか?このような製品が成功するのに十分な時間が経過し、顔にカメラを取り付けることに対する感性は変わったのだろうか?

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する