Apple の10億ドル規模の AI 投資ーー研究者がマルチモーダル AI でブレークスルーを達成

SHARE:
Credit: VentureBeat made with Midjourney

Appleの研究者たちが、マルチモーダル AI の分野で大きな進歩を遂げ、同社が AI への投資を増強している。

Apple の研究者らは、大規模な言語モデルをテキストと画像の両方で訓練する新しい手法を開発した。これにより、より強力で柔軟な AI システムが実現可能になり、人工知能にとって、そして将来の Apple 製品にとって大きな前進となる可能性がある。

この研究は、「MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training」と題された研究論文で説明されており、今週ひっそりと arxiv.org に掲載された。さまざまな種類のトレーニングデータとモデルアーキテクチャを慎重に組み合わせることで、AI ベンチマークの範囲で最先端のパフォーマンスを達成できることが示されている。

研究者らは次のように説明している。「視覚情報と言語情報にまたがる多様なデータセットでモデルをトレーニングすることで、MM1 モデルは画像キャプション、視覚的質問応答、自然言語推論などのタスクで優れた性能を発揮できました」。

視覚コンポーネントのスケーリングが鍵

研究者らはまた、画像エンコーダーの選択と入力画像の解像度が、モデルのパフォーマンスに大きな影響を与えることを発見した。「画像エンコーダーは、画像の解像度と画像トークン数とともに、実質的な影響を与えますが、ビジョン・ランゲージ・コネクターの設計は比較的重要ではありません」と彼らは述べている。これは、これらのマルチモーダルモデルの視覚コンポーネントの継続的なスケーリングと洗練が、さらなる進歩のカギとなることを示唆している。

驚くべきことに、最大の300億パラメータを持つ MM1 モデルは、強力な文脈学習能力を示し、少数のショット「思考の連鎖」プロンプトを使用して、複数の入力画像に対する多段階の推論を実行できるようになった。これは、大規模なマルチモーダルモデルが、言語の理解と生成、および根拠に基づいた複雑でオープンエンドな問題に取り組む可能性を示している。

Apple の10億ドル規模の AI 投資

MM1 の研究は、Apple が人工知能への投資を増やしている中で行われたものだ。同社は、 Google、 Microsoft、 Amazon などのライバルに追いつくため、生成 AI 機能を製品に統合することに力を入れている。Bloomberg の最近のレポートによると、同社は AI 開発に年間10億ドルを費やす予定だという。

情報筋によると、 Apple は「Ajax」と呼ばれる大規模言語モデルのフレームワークと、社内で「Apple GPT」として知られるチャットボットに取り組んでいるという。目標は、これらのテクノロジーを Siri、 Messages、 Apple Music などのアプリやサービスに統合することだ。例えば、AI を使ってパーソナライズされたプレイリストを自動生成したり、開発者がコードを書くのを支援したり、自由なテーマの会話やタスクを完了させたりすることができる。

Apple の CEO である Tim Cook(ティム・クック)氏は、最近の決算説明会で次のように述べている。「私たちは、AIと機械学習を基本的なテクノロジーと見なしており、出荷するほぼすべての製品に不可欠なものです」、「詳細については触れませんが、かなりの投資をしていることは確かで、責任を持って行い、それらのテクノロジーが中心となる製品の進歩が見られるでしょう」。

AI 軍拡競争の重要性

Apple には大きな技術シフトに関して、先駆者ではなく後発者であるという歴史がある。

しかし、AI がデジタルランドスケープのあらゆる側面を変革しようとしている中、iPhone メーカーにとって競争力を維持することは重要な意味を持つ。MM1 の研究は、 Apple が最先端の進歩を遂げるための人材と資源を持っていることを示している。しかし、極秘主義で知られる同社が、エスカレートする AI 軍拡競争のペースについていけるほど迅速に行動できるかどうかは、まだわからない。

多くの人々が6月の Apple Worldwide Developers Conference に注目しているが、そこでは同社が AI を活用した新機能や開発者ツールを発表すると予想されている。一方、 Keyframer アニメーションツールやパフォーマンスの向上など、 Apple の研究所から出てくる小さな AI の進歩は、舞台裏で着実に進歩が続けられていることを示している。

Cook 氏が最近の Q1決算説明会で「今年後半には、AI での進行中の取り組みの詳細をお伝えできることを楽しみにしています」と何らかの発表があることを示唆を示している。その取り組みには、最大規模でマルチモーダルな知性をマスターするための野心的な努力が含まれていることが、今や明らかになっている。

「普遍的に役立つ人間のような AI の時代は、我々が考えているよりも早く到来するかもしれない。そして Apple は、それを形作る上で大きな役割を果たすつもりだ」。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する