2024年の生成AI予測：海外トップVCの見解 - BRIDGE（ブリッジ）テクノロジー＆スタートアップ情報

2023年が終わろうとしている今（※）、この1年をめぐるAIについても記念碑的な進歩（そして倫理的な議論）を振り返っている人も多いだろう。Bing Chatや Google Bardのようなチャットボットの登場は驚異的とも言える自然言語能力を示し、DALL-E 3や MidJourney V6のような生成AIモデルは創造的な画像生成で驚きを与えた。

一方でAIの潜在的な弊害についても懸念が提起された。EUの象徴的なAI法は技術の特定の用途を制限しようとし、バイデン政権はその開発に関するガイドラインを発表した。急速な技術革新が今後も続くと予想される中、多くの人が疑問を抱いていることだろう。

すなわち、AIの次はどうなるのか？という点だ。

そこでそれを知るために、AIスタートアップたちに投資している大手ベンチャーキャピタルを対象に、2024年に何が起こるかについての大胆な予測を聞いた。誇大広告と現実が交錯する中、再び「AIの冬」が訪れるのだろうか？それとも、新たなブレークスルーが業界全体の採用を加速させるのだろうか？政策立案者や一般市民はどのように対応するのだろうか？

Bain Capital Ventures（BCV）、Sapphire Ventures、Madrona、General Catalystをはじめとするトップ企業のVCが、生成AIの将来からGPU不足、AI規制、気候変動への応用などのトピックについて展望を語った。リスクやタイムラインについては見解が分かれるところだが、2024年が人工知能にとって決定的な年になることは間違いないという点では、大方の意見が一致している。AIに何が起こるかについての彼らの大胆な予測と洞察についてぜひチェックいただきたい。

生成AIスタートアップの盛衰

生成AI企業の多くは死ぬだろう。もしあなたが、今年モンスター級のラウンドを調達したスタートアップの1つでなかったなら、将来はあなたにとって不透明なものになる。多くの生成AI企業は互いに競合し、OpenAIの上に構築されたスタートアップはプラットフォームリスクを経験し、これらの企業への資金調達は枯渇する。Day One Venturesではこのような案件を全く見なくなった。

私は、バイオテクノロジー、ゲノム、気候、産業への応用におけるAIに期待している。AIは、科学者や研究者がヒトのゲノムデータに基づいて新しい治療法や診断法を開発するのを支援することで、人々の命を救うことになるだろう。サイケデリック医薬品業界では、当社のポートフォリオ企業であるMindstateが、治療抵抗性PTSD（treatment-resistant PTSD）の治療に役立てるため、最大規模の包括的データセットに基づいて新しい「心の状態」を作り出すためにAIを活用している。不妊治療、生殖、長寿におけるAIは、人間の寿命と子供を産む方法のパラダイムを完全に変えるだろう。気候の分野では、Vibrant PlanetがAI/MLを使って世界的に起きている壊滅的な山火事を防いでいるように、企業はAIを使って生態系を守ろうとしている。

AIはまた、人の心の中で起こっていることを読み取り、その思考のイメージを投影することもできるようになるだろう。これは非常に魅力的で、人間の意識や無意識に関する知識をどのように解き明かすのか、興味津々だ。

Masha Bucher（Founder and General Partner at Day One Ventures）

マルチモーダルモデルにおけるデータモダリティ

2024年はテキスト、画像、音声といったデータモダリティがマルチモーダルモデルに統合され、AIの能力が再定義されるだろう。これらのモデルを活用する新興企業は、より良い意思決定と、パーソナライゼーションを含むユーザー体験の向上を可能にするはずだ。

製造業、電子商取引、ヘルスケアなどの業界全体で、斬新で変革的なユースケースが見られるだろう。インフラ側では、AIのワークロードはより厳しくなり、マルチモーダルデータベースにまつわるイノベーションが起こると予想される。すべてのユースケースがマルチモーダルモデルを必要とするわけではないが、多くの分野で第一世代のLLMスタートアップが新たな競争に直面し、イノベーションを継続し、競合に対抗するプレッシャーに晒されるはずだ。

Cathy Gao（Partner at Sapphire Ventures）

2024年のAI製品は、マルチモーダル検索とマルチモーダル推論が主役になるだろう。現在のAI製品はほとんどがテキストだ。しかし、ユーザーは、音声、ビデオ、オーディオ、コードなど、あらゆるモダリティで対応する、より表現力豊かなソフトウェアを好む。

このようなアーキテクチャーを大規模に機能させることができれば、私たちは、より正確で人間らしい結果を提供するソフトウェアを開発できるかもしれない。例えば、答えを描いたり、自分の声や口調で電話をかけたり、他のAIや人間と協力して最適な結果にたどり着いたりすることができるようになる。これにより、会議に参加する必要が減ったりするのだ。

これを実現するために、UnstructuredのようなETLプロバイダーが新しいデータソースを含むように多様化し、MetaのSegment Anythingアーキテクチャを利用する新興企業が増え、Contextualのような新興企業がマルチモーダル検索の本格的なソリューションになることを期待している。

Rak Garg（Principal at Bain Capital Ventures）

私たちは、AIがより多くのユースケースで開花するのを見続けている。医療分野では、コンピュータ・ビジョンを使ってがんを発見したり、機械学習を使ってより良い診断をしたり、生成AIを使って事務作業を減らしたりする可能性に興奮している。米国では医療に4.3兆ドルを費やしており、GDPに占める割合はOECDの平均のほぼ2倍だ。一方、その3分の1近くは管理費だけであることを考えたい。

また、チャットは2023年の重要なバズワードだったが、企業は2024年にチャットを超えて考える必要がある。このインプット、トレーニング、モデル作成、出力にわたるマルチモーダルAIは、イノベーションの重要な分野となるだろう。

Amit Garg（Managing Partner at Tau Ventures and Sanjay Rao, Managing Partner at Tau Ventures）

マルチモーダルモデルは、AIエージェントとの魅力的なインタラクションをより簡単に作成できるようになり、AIの質は特定のユースケースにおいて、人が人間とコンピューターの違いを見分けることをほとんど不可能にするだろう。これはCharacter.AIやInstagramのような場所ですでに起こっていて、トレーニング、カスタマーサポート、マーケティング／セールスのような分野で定着すると予想される。あなたが思っているよりも早く機械と関係を築くことになるはずだ。

Jess Leao（Partner at Decibel VC）

オープンソースによるAIの民主化

私たちは、2024年にはより多くのオープンソースモデルがリリースされると予測しており、特に大手のハイテク企業が主要なプレーヤーのひとつになると考えている。その例としては、Tesla、UberやLyft（どちらも歴史的にオープンソースプロジェクトへ大きな貢献を果たした）、さらにはSnowflakeのような企業が挙げられる。これらのモデルのいくつかがスピンアウトし、大規模な資金調達を受けたとしても、私たちは驚かない。

Vivek Ramaswami（Partner at Madrona and Sabrina Wu, Investor at Madrona）

私はマルチモーダルが24年下半期までに、大規模なモデルプロバイダーのデファクトスタンダードになると見ている。歴史的に独自のモデルを維持してきた主要なモデルビルダーは、AGIのベンチマークをめぐる話をリセットするため、新たなベンチマークをリリースする一方、一部のIPをオープンソース化し始めるだろう。

Chris Kauffman（Partner at General Catalyst）

OpenAI、Mistral、Google、その他オープンソースモデルを提供する企業間で、ジェネレーティブAIの価格競争が起きている。ほとんどの企業は、既存のハードウェア・インフラ（トークンごとの入出力コストで証明される）を使って損失を出しており、ボリュームでそれを補うことを考えている。生成AI企業にとって必要なことは明確だ。このニーズに基づき、VCの投資は効率的なモデルの開発、新しいAIコンピューティング・ハードウェアの活用、業界固有のモデルの微調整やコンプライアンスなどの付加価値サービスの提供に向かうのではないだろうか。

Jimmy Kan（Partner at Anzu Partners）

GPU不足：持続的な問題か、一時的な停滞か？

2024年はリアルタイム・ディフュージョン・アプリケーションの年になるだろう。2023年には、Songらによるオリジナルの一貫性モデルの論文や、最近ではLCMなど、ディフュージョンモデルの推論速度に関する理論的な大きな改善が見られた（Adversarial Diffusion Distillationも）。Dan WoodのArt Spew（1秒間に77枚の512×512画像を4090で処理）、Modalのturbo.art（SDXL Turboベース）、fal.aiの30fpsフェイススワップなどがそれに当たる。2024年には、より多くのリアルタイム画像、オーディオ、ビデオ生成ディフュージョン・アプリケーションが登場するだろう。

Slater Stich（Partner at Bain Capital Ventures）

GPU不足はスタートアップのエコシステムを荒廃させ続け、新しい企業が製品を市場に投入することを難しくしている。この問題を解決するには2つの方法がある。AIにおけるNVIDIAの独占から抜け出す新しいコンピューティング・オプションが登場するか、コンピュート・リソースをより効率的に利用できる新しいモデル／アーキテクチャが登場するかだ。大量の資金が、Cartesia AI社のMambaのような、二次時間ではなく線形時間で実行される新しいモデル・アーキテクチャや、トランスフォーマ・ベースのLLMに代わるより高速で安価で高性能な拡散モデル、リキッド・ニューラル・ネットを中心に構築されたプラットフォームに投入されることを期待している。

Rak Garg（Principal at Bain Capital Ventures）

まず、GPU不足は必ずしも皆が考えているほど深刻でも決定的でもない。より大きな問題は、既存のインフラに対する利用率の低さであり、これはサプライチェーンの継続的な制約と並んで2024年も続くと私は考えている。AIのための低レベルのソフトウェアを修正することが、幻のGPU『不足』を解決する鍵になるはずだ。そして、もっと現実的な利用率の問題も解決されるだろう。それまでの短期的な解決策としては、単純に計算量を増やすしかない。とはいえ、GPUの制約は2024年も続き、世界のNVIDIAは引き続き受注浅を経験する一方、競合他社（すなわちAMDとIntel）は需要側の絶望の結果としてGPU市場シェアのそれぞれ1～2％を獲得するだろうと私は予測している。

Chris Kauffman（Partner at General Catalyst）

GPUが不足することはないはずだ。市場は、ほんの一握りのバイヤーとサプライヤーに収束するだろう。NVIDIAやその他の企業は、予測される需要を満たすために規模を拡大し、Microsoft、Google、Amazon、Meta、そして多くの中心となる企業群は、依然として大規模な買い手となるだろう。それ以外の人々はクラウド・プロバイダーからレンタルすることになるが、リース可能な容量は十分にあるだろう。金持ちはより金持ちになるだろうが「GPU貧乏人」の生活の質は向上するはずだ。

Jess Leao（Partner at Decibel VC）

台湾セミコンダクター・マニュファクチャリング・カンパニー（TSMC）会長によれば、「AIチップの不足はない」そうだ。しかし、生産におけるAIの長期的な持続可能性は、Nvidia H100やAMD MI300Xのような汎用GPUには依存しないだろう。投資対象は、トレーニングよりも推論に特化したハードウェアにシフトするだろう。d-MatrixやEnCharge AIのようなNPUイノベーションは、ニア・メモリー・コンピューティングを活用し、ローカルのAI PCにもデータセンター内にも導入できる、費用対効果が高く環境に優しいソリューションとして台頭してきている。

Jimmy Kan（Partner at Anzu Partners）

AppleとGoogle：眠れる巨人？

2024年にはAppleから大きなリリースがあり、おそらく独自のGPTもリリースされるだろうと考えている。社内でAjax GPTとして知られているAppleのLLMが報告されているからだ。このモデルは内部用に作成されたものだが、来年はアップルがAjax（または関連モデル）をより一般的に公開したり、アプリ（XCode、Apple Musicなど）やデバイス（Mac、Vision Proなど）に生成AI機能を取り入れたりする可能性がある。これはAIというより機械学習だが、Appleは先週、MLXをリリースした。これはAppleシリコン用に特別に設計された効率的な機械学習フレームワークだ。このリリースは既存のモデルだけでなく、消費者向けデバイスメーカーとしての顕著な役割を考えると、米国が規制にどのようにアプローチするかに大きな影響を与える可能性がある。

Vivek Ramaswami（Partner at Madrona and Sabrina Wu, Investor at Madrona）

2023年がオープンAIの年であり、Microsoftがそれを独占したとすれば、来年はGoogleの話題で持ちきりになるだろう。GoogleのGeminiへの多額の投資と、比類のないデータと計算リソースは、開発者にあらゆる形とサイズのGPT-4+機能を提供し、すべての基盤モデルプロバイダーのフロンティアを押し広げるはずだ。まだ彼らを無視してはならない。

Jess Leao（Partner at Decibel VC）

長期的なAIシフトに備える

この1年でAIに飛び込んだ誰もが、2024年にはチップレットとは何かを知ることになるだろう。ムーアの法則の限界に挑み続ける中で、チップレットのような新しいコア半導体アーキテクチャだけでなく、先進的なパッケージングやインターコネクトなど、新しいアーキテクチャのパラダイムも登場するだろう。

Chris Kauffman（Partner at General Catalyst）

エッジ・ツー・クラウド、あるいは「ハイブリッドAI 」は、スマートフォン、ラップトップ、自動車、IoTデバイスのようなクラウドとエッジデバイスの両方を統合することで、パフォーマンス、パーソナライゼーション、プライバシー、セキュリティの面でメリットをもたらす。生成AIモデルが縮小し、オンデバイス機能が向上するにつれて、このアプローチはますます実現可能になり、長期的にグローバルな企業や消費者のニーズを満たすためにAIを拡張する上で不可欠になるだろう。

Jimmy Kan（Partner at Anzu Partners）

【via VentureBeat】 @VentureBeat

【原文】

※原文は年末掲載です