
(前編からの続き)
AI開発・ライフサイエンスにおけるイノベーションのスピードアップ
Tabnineが行ったように、ソフトウェアやAIアプリケーションの開発のスピードアップが、価値の高いユースケースとして浮上している。今のジェネレーティブAI技術は、生産性と精度を最適化するためのソフトウェアエンジニアの努力を補強するものだ。
NLP Cloudは、組織がAIモデルを微調整して展開するのを支援する高度なソフトウェアサービスで、その大規模言語モデルはDevOpsなしで簡単にテキストの理解や生成、エンティティの抽出を可能にしている。
大規模言語モデルはAIが人間の言語を理解するのを助けてきたが、用途はそれだけに限らない。新たに開発が進み、生体分子データや化学データに対する大規模なニューラルネットワークの学習が容易になりつつある。これらの「言語」を理解する能力のおかげで、研究者は生物学的配列や人間の健康状態における新しいパターンや洞察を発見できるAIを開発・展開することができる。そのためバイオテクノロジーや製薬のトップ企業は、創薬研究を加速させるために、Nvidiaが近々提供するサービス「BioNeMo」を採用している。
Nvidia Inceptionプログラムに参加するバイオテクノロジースタートアップPeptoneの機械学習リーダーIstvan Redl氏は、次のように述べている。
タンパク質分野における大規模言語モデルの採用がますます広がっており、大規模言語モデルを効率的にトレーニングし、モデル・アーキテクチャを迅速に変更する能力が非常に重要になってきています。スケーラビリティと迅速な実験という、この2つの工学的側面は、まさにBioNeMoのフレームワークが提供できるものだと考えています。
ミュンヘン工科大学のRostlabの研究や、ハーバード、イェール、ニューヨーク大学などのチームによる研究も、タンパク質、DNA/RNAの理解や、デノボ化学構造の生成に貢献している。
次は何が来る?
専門的なフレームワーク、サーバー、ソフトウェア、ツールができたことで、大規模言語モデルはより実現可能で手の届くものになり、新しいユースケースを推進するようになってきた。AIや機械学習の分野でも、すでに新たな技術革新の波が押し寄せている。 GPT-4のリリースが待ち望まれる中、Transformer AIはAIシステムの学習・構築方法を根本的に変える大きな進歩であるとの見方が強まっている。
企業にとって大規模言語モデルは、モデル構築のための人材不足によって妨げられているAIの採用を促進することを叶えるものだ。わずか数百のプロンプトで基礎的な大規模言語モデルをAIの専門知識がない組織でも簡単に活用できることは大きなプラスだ。
多くのアナリストは、大規模言語モデル技術や業界は今後10年間で成熟し、急成長し続けるだろうと予測している。昨年は、MicrosoftとNvidiaが発表した5300億パラメータの大規模言語モデルであるMegatron-Turing NLGなど、新しい大規模モデルが続々と登場した。このモデルは、リスクの低減や不正行為の特定、顧客からのクレームの削減、自動化の促進、顧客感情の分析など、さまざまな用途で使用されている。
継続的な研究と商業化により、計算写真、教育、モバイルユーザーのインタラクティブな体験など、あらゆる種類の新しいモデルやアプリケーションが生まれると予測されている。業界内のスタートアップを集計すると、ジェネレーティブAIだけで150社以上存在する。
MicrosoftのAI & HPCベンチマークに関する技術プログラムマネージャーのHugo Affaticati氏は次のように述べている。
顧客は、巨大なGPT-3モデル上でテキスト生成を継続的に自動化し、比類のない応用範囲、精度、レイテンシを実現しています。Nvidia NeMo MegatronをAzureのインフラと組み合わせることで、常に進化する問題を解決するために必要なスケーラビリティ、適応性、大きな可能性を提供します。Microsoftは最新のGPUや何兆ものパラメータを持つ全モデルなど、常に最新の提供物をクラウドに導入することを約束しているので、大規模言語モデルの未来はかつてないほど明るいものになっています。
ロボット制御は特に有望なフロンティアだ。研究者たちは現在、製造、建設、自動運転、パーソナルアシスタントなどに使われるロボットの発展に、トランスファーベースのモデルを使用している。 強力で大規模言語モデルが従来の畳み込みAIモデルに取って代わり続けるという見方もある。その好例が、Meta AIとダートマスの研究者が設計したTimeSformerで、トランスフォーマーを使って動画を解析している。
実際、Transformer AIの基礎モデルは、AIにとって大きなパラダイムシフトとなる可能性を示している。特定のタスクのために構築され、維持されているほとんどの大規模言語モデルとは異なり、1つの基礎モデルは多種多様なタスクに対応できるように設計することができる。例えば、スタンフォード大学では最近、これらを探求するための新しいセンターを設立した。
スタンフォード大学の研究者たちは次のように述べている。
ここ数年の基礎モデルの規模と範囲は、何が可能かについての我々の想像力を大きく膨らませました。社会にとって有益なアプリケーションを幅広く提供することが期待できます。
企業にとって実用的価値は、ダース・ベイダーが氷上で釣りをする「芸術的」な画像を生成することをはるかに超えることは間違いない。
【via VentureBeat】 @VentureBeat
BRIDGE Members
BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。- 会員限定記事・毎月3本
- コミュニティDiscord招待