Meta、「GPT-4V」に匹敵するマルチモーダルAIをレイバンのスマートグラスでテスト開始

SHARE:
Image credit: Ray Ban

Facebook、Instagram、WhatsApp、Oculus VR の親会社 Meta Platforms からのニュースだ。新音声クローン AI「Audiobox」のリリースに続き、同社は今週、アイウェアの代表的企業 Ray Ban との提携により、Ray Ban Meta スマートグラス上で動作するように設計された新しいマルチモーダル AI の小規模なトライアルをアメリカで開始すると発表した。

この新しい Meta マルチモーダル AI は、2024年に一般公開される予定だと、長年フェイスブックで Meta の CTO を務めてきた Andrew Bosworth 氏(通称〝Boz〟)が Instagram に投稿した動画が伝えている。

来年、私たちは、あなたが質問したことだけでなく、あなたの周りの世界についての情報を与えるために、スマートグラスのカメラを活用する AI アシスタントのマルチモーダルバージョンを発売する予定です。そして、今週から、このマルチモーダルAIを米国で早期アクセスプログラムを通じてベータテストすることになり、とても興奮しています。(Bosworth 氏)

Bosworth 氏の投稿には、プログラムへの参加方法は含まれていない。

9月にパロアルトで開催された Meta の年次カンファレンス「Connect」で発表された最新バージョンのスマートグラスは、エントリー価格で299米ドルで、すでに AI アシスタントを内蔵した現行モデルが出荷されている。それでもかなり限定的で、動画や写真にインテリジェントに反応することはできず、ましてや(スマートグラスにはカメラが内蔵されているにもかかわらず)装着者が見ているものをライブビューで見ることはできない。

その代わり、このアシスタントは音声で操作できるように設計されており、具体的には、Amazon の「Alexa」や Apple の「Siri」に似た音声アシスタントのように、装着者が話しかけるようになっている。

Bosworth 氏は自身の Instagram の投稿で、マルチモーダルバージョンの新機能のひとつを紹介した。そのなかには、スマートグラスをかけ、オフィスのカリフォルニア州を示すウォールアートの照明を見つめるビデオクリップも含まれている。興味深いことに、彼はスマートフォンも手にしているようで、AI が機能するためにはスマートグラスとペアリングされたスマートフォンが必要であることを示唆している。

新しい Meta マルチモーダル AI の見かけのユーザインターフェース(UI)を示す画面では、Bosworth 氏の「見て、何が見えるか教えて」という質問に見事に答え、そのアートを「木彫りの彫刻」と識別し、それを「美しい」と言った。

Meta のマルチモーダル AI のベータ版を示す動画
Image credit: Bosworth 氏の Instagram

Meta の製品やプラットフォーム全体が AI を全面的に受け入れていることや、同社の特徴である大規模言語モデル(LLM)「Llama 2」を通じてオープンソース AI を推進していることを考えれば、この動きは予想されたことかもしれない。しかし、マルチモーダル AI への初の試みが、web 上のオープンソースモデルという形ではなく、デバイスを通じて行われたことは興味深い。

OpenAI の「GPT-4V」を実行する「Ai Pin」の開発元 Humane をはじめ、いくつかの小規模スタートアップが、専用の AI デバイスで最初の試みを行っている。

一方、OpenAI は独自のマルチモーダル AI である GPT-4V(「V」は「Vision」を意味する)を iOS と Android 向けのChatGPT アプリを通じて提供する路線を追求しているが、このモデルへのアクセスには Chat GPT Plus(月額20米ドル)または Enterprise サブスクリプション(変動価格制)が必要だ。

この動きは、2010年代に Google が行った「Google Glass」の不運な試験も思い起こさせる。Google Glass は初期のスマートグラスのプロトタイプで、発売前に大々的な宣伝が行われたにもかかわらず、そのファッションセンス(またはその欠如)と、目に見えるアーリーアダプター層(「Glassholes」という言葉が生まれた)で嘲笑され、実用的な使用例も限られていた。

Meta の Ray Ban Meta スマートグラス用の新しいマルチモーダル AI は、Glasshole の罠を避けることができるのだろうか?このような製品が成功するのに十分な時間が経過し、顔にカメラを取り付けることに対する感性は変わったのだろうか?

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。
  • 会員限定記事・毎月3本
  • コミュニティDiscord招待
無料メンバー登録