Krutrim、Bharat GPT、CoRover……頭角を表し始めたインドのジェネレーティブAIたち

SHARE:
2023年12月に開催された「Krutrim」説明会で、オーディエンスの質問に答えるチームメンバー
Image credit: Ola

昨年 Sam Altman(サム・アルトマン)氏がインドを訪問した際、彼は1,000万米ドルの資金を持つスタートアップが基礎モデルのトレーニングで OpenAI に対抗するのは不可能だと述べた。この発言は大きな話題となり、インドの IT 企業 Tech Mahindra の元 CEO である C. P. Gurnani 氏は、インドでネイティブにジェネレーティブ AI を構築する挑戦は受け入れられたと意欲的に語った

早いもので2024年初頭、テクノロジーの才能と企業で知られるインドは、ジェネレーティブ AI の道を順調に歩んでいる。しかし、興味深いのは、OpenAI の GPT モデルに挑む具体的な最初のインドのプレーヤーは、Tech Mahindra ではなく、ご存知の通り、配車サービス会社 Ola Cabs を設立して Uber に対抗した Bhavish Aggarwal 氏が設立したスタートアップだということだ。

「人工」を意味する Ola Krutrim は先月、最初の言語モデル「Krutrim」と、その上に構築されたチャットボットをデビューさせた。Tech Mahindra や Reliance Industries を含む他の企業もこの競争に参加し、追いつこうとしている。

ローカライズされた体験を提供する競争

2023年12月に開催された「Krutrim」説明会で話す Ola Cabs 共同創業者 Bhavish Aggarwal 氏
Image credit: Ola

OpenAI の GPT 群や Meta の「Llama」のような基盤モデルは、言語、回答、コードの生成においてかなり良い仕事をする一方で、英語以外の言語、特に低リソース言語の(デジタルフットプリントが小さい)クエリを処理するのに苦労することがある。

これに対処し、よりローカライズされた経験を提供するために、韓国フィンランド中国を含むさまざまな国のテクノロジー企業が、トレーニングデータにおける現地の言語や文化的背景の表現を増やすアプローチで、独自のモデルのトレーニングを開始している。

同じ課題が、インドのジェネレーティブ AI の野心も妨げている。しかし、この場合の問題は何倍も大きい。インドには14億人、つまり世界人口の18%近くが住んでおり、22の公認言語、1,600以上の方言、19,200の非公式方言がある。Altman 氏が示唆したように、そのすべてを網羅するモデルをトレーニングすることは、それ自体が大変な作業であり、資本集約的なものであることは間違いない。

ライドヘイリングサービスの提供や電気自動車の販売を経て、Aggarwal 氏は2023年4月に Krutrim を法人化し、この課題に挑んだ。同社は Matrix Partners から2,400万ドルの負債を調達し、2兆トークンをベースに Krutrim を育成した。これは、他のモデルよりも20倍以上も多く、インド諸語の最大の表現が含まれていると起業家は発表時にアピールした。

Krutrim はインドのエートスを持っています。Krutrim は、インドの文化的感覚と関連性を生得的に感じながら、テキストとコードを生成します。(Aggarwal 氏)

現在のところ、Ola のモデルは20のインド言語を理解し、ヒンディー語と英語を含む10の言語を生成する。

同社によると、指標言語全体における性能はすでに GPT-4より優れているが、英語の品質性能はまだ遅れている(今後数カ月で改善される見込み)。

同社は段階的に開発を進めており、公式に認識されているすべてのインド系言語のサポートや、テキスト、視覚、音声をサポートする複雑な問題解決のための Pro 版モデルなど、複数の開発を準備している。

企業向けに提供されるモデルに加え、Aggarwal 氏とチームはインド人向けに ChatGPT のようなチャットボット体験を構築した。ただし、現段階では一般公開されていない。同社は AI スーパーコンピュータを構築するため、ハードウェア面でも研究開発を進めている。

追いつこうとする大企業

Krutrim のモデルが現実の世界でどのように機能するかは未知数だが、開発者や消費者が使い始めたとき、同社は注目されるジェネレーティブ AI の分野であらゆる分野をカバーする最初のインド企業のひとつとなるだろう。

追いつこうとしている他の注目すべき企業は、Tech Mahindra と億万長者 Mukesh Ambani 氏の Reliance Industries だ。

Tech Mahindra は Gurnani 氏の指揮の下、2023年8月にインダス・プロジェクトの下でオープンソースの大規模言語モデル(LLM)の開発に着手し、最近社内でベータテストを開始した。

この製品は2024年2月にデビューする予定で、5億3,900万個のパラメータと100億個のヒンディー語+方言トークンを持つ純粋なヒンディー語 LLM になると言われている。この場合でも、すべての言語がサポートされているわけではない。

最初の段階では、ヒンディー語と37以上の方言の LLM を作成し、その後、他の言語や方言をカバーするために段階的に進めていく予定です。(Reliance Industries の web サイト)」

一方、Jio でインドの4G の波をリードし、Google、Meta、Intel などの支援を受けている Reliance Industries は、AI の競争ではやや動きが鈍いようだ。

Image credit: Reliance Industries

同社は昨年の年次総会で、インド向けの言語モデルを構築する計画を発表した。その後、Nvidia と提携して GH200スーパーチップを入手し、インド最速のスーパーコンピューターよりも強力な AI インフラを構築した。現在、インド工科大学ボンベイ校のチームと協力し、「Bharat GPT」と名付けられたプロジェクトを実現させようとしている。

詳細はあまり共有されていないが、Reliance は Jio が提供するものを含め、顧客向けの製品やサービス全体に GPT の提供を導入する計画のようだ。同社が ChatGPT のような消費者向けチャットボットを別途立ち上げるかどうかは不明だ。

Reliance や TechM と並んで、最近4,100万ドルの資金調達でステルス状態から脱したベンガルール(バンガロール)拠点の Sarvam AI も大きな注目を集めている。

このスタートアップは、Llama2をベースとした70億パラメータの Indic 言語モデルを構築し、それを使って企業がジェネレーティブ AI アプリを構築できるよう、企業中心のプラットフォームを立ち上げる計画だ。

Google が支援する Corover は、会話型エンタープライズ・チャットボットのプラットフォーム用に、22言語をサポートする Indic 言語モデルを構築したとも主張している。

ジェネレーティブ AI でより良い体験を

エコシステムが進化し、より多くのプレーヤーが登場し、技術が成熟するにつれて、より洗練されたクローズドおよびオープンソースのインド語言語モデルが国内で形作られることが期待される。これらはすべて、企業内部のワークフローを改善するだけでなく、さまざまな分野で事業を展開する組織にとって、より優れたアプリケーションにつながるだろう。

例えば、Tech Mahindra は Indus Project の LLM が、1億4,000万人以上の農民のためのデジタルヘルパーの開発につながり、ローンや農薬など農業関連の必要な情報を、彼らが好む言語で提供できると指摘している。

また、医療や金融のキオスク端末に搭載して、現地の方言の音声を解読し、有用な情報を瞬時に提供することもできる。可能性は無限だ。

また、GPT-4.5に向けて開発を進めている OpenAI や、最近 Gemini シリーズを発表した Google のようなマーケットリーダーを含め、これらのモデルがパフォーマンス面で世界の競合他社に対してどのような結果を出すのかも興味深い。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する