ビッグデータ分析のDatabricks、LLM開発のMosaicMLを13億米ドルで買収——MosaicML CTOに聞いた技術の強み

SHARE:
MosaicML 共同創業者 兼 CTO Hanlin Tang 氏
Photo by Hou Junwei(侯俊偉)氏

ビッグデータ分析企業の Databricks は今年6月、AIスタートアップの MosaicML を13億米ドルで買収したと発表した。MosaicMLは 設立後わずか11カ月で11億ニュー台湾ドル(約50億円)を調達したが、彼らの技術のどこがすごいのだろうか? (以下は2022年1月11日のインタビューから)


2021年10月、機械学習(ML)アルゴリズムの効率を最適化するスタートアップ MosaicML は、シリーズ A ラウンドで2,170万米ドルを調達し、累積調達額は3,700万米ドルに達した、このラウンドには Lux Capital、DCVC、Future Ventures、Playground Global、AME、Correlation、E14 などが参加し、台湾 Mesh Ventures(聚達創投)創業者 Edward Chyau(喬国筌)氏も個人的な立場で投資した。

特筆すべきは、シリーズ A ラウンドの資金調達時、このスタートアップは設立からわずか11ヶ月しか経っておらず、創業メンバーは以前、半導体大手 Intel に買収された会社(Nervana)に所属していたということだ。この優れた実績と資金調達の速いペースが相まって、人々は MosaicML の進展に期待を寄せた。

MosaicML の共同創業者兼 CTO Hanlin Tang(湯漢林)氏は次のように語った。

AI チームを持たない中小企業にとって、AI コンピューティングのコストと性能は依然として障壁であり、Intel の元を離れてもこの問題を解決したいと考えています。

プロジェクトの失敗、それでもカムバックを決意

2014年の時点で、MosaicML の創業者 Naveen Rao 氏はは、今後ますますデータが増えれば、企業における AI の開発は必然的に高コスト・低性能という状況に陥ることに気づいていた。

Forbes によると、AI 研究組織 OpenAI は、数千台の高性能 GPU を使用して、1,750億パラメータの GPT-3 を3ヶ月以上で学習させたが、その推定コストは1,200万米ドル近くであり、中小企業が時間と資本の面で負担できるコストではないことは明らかだ。

そこで Rao 氏は、大企業にハードウェアチップからクラウドコンピューティングソフトウェアまで、AI 開発のためのワンストップサービスを提供するために Nervana を設立し、チームの専門性によってコンピューティングリソースの不必要な浪費を減らそうと試み、2015年に台湾出身の Tang 氏がソフトウェアエンジニアとして入社した。

MosaicML のチーム。左から:創業者兼 CEO Naveen Rao 氏、コンサルタントの Michael Carbin 氏、コミュニティディレクタの Julie Choi 氏、データサイエンスディレクタ Jonathan Frankle 氏、CTO Hanlin Tang(湯漢林)氏
Image credit: MosaicML

チームが Intel から買収の誘いを受けたとき、Tang 氏はまだ入社して1年しか経っていなかった。

結局のところ、 Intel に認められるのは簡単なことではないのですが、私たちは皆、とても興奮しました。(Tang 氏)

Intel が AI 市場に大きく進出していた頃、当時のエグゼクティブバイスプレジデント Diane Bryant 氏は、ML サーバの97%以上が Intel Xeon E5 や最近発売された Xeon Phi など Intel プロセッサを使用しており、Nervana 製品は AI 分野へのさらなる進出を後押しするだろうと述べていた。

しかし、世界は予測不可能だ。その後、NVIDIA が急躍進。Nervana の有効性は Intel が期待に応えられず、Intel は Nervana を明確に放棄したわけではないが、2020年以降、 Nervana の研究開発を減速させた。

この結果は残念でしたが、Intel 在籍時の AI 研究開発の経験と成果は、依然として確かなものだったと考えています。(Tang 氏)

Tang 氏は Intel 在籍時、彼らの顧客は主に中小企業だったが、こうした中小企業は大企業以上に AI を開発するリソースが不足しており、彼らが事業初期に観察していた問題が現実のものとなっていると述べた。

MosaicML 共同創業者 兼 CTO Hanlin Tang 氏「Intel に買収されるなど浮き沈みを経ても、創業チームは初心を忘れていない。」
Photo by Hou Junwei(侯俊偉)氏

問題がまだそこにある以上、私たちは「それを解決する」という目標に向かって進み続けます。(Tang 氏)

オープンソースのソフトウェアエコシステム構築を優先、ハードウェアを諦める

2020年12月、Rao 氏、Tang 氏らは MosaicML を設立した。MosaicML は、ソフトウェアとハードウェアの両サービスをワンストップで提供する Nervana とは異なり、AI アルゴリズムのパフォーマンスを加速・最適化する SaaS を提供することで、AI 機能を持たない中小企業をターゲットとしている。なぜハードウェアサービスを諦めるのか?

すでにハードウェアソリューションの選択肢が多すぎて、かつてのオーナーである Intel と Nvidia の製品だけではイノベーションを生み出すのは難しいので、ソフトウェア開発に注力することにしました。(Tang 氏)

中小企業が直面する問題としては、大企業のように独自のAIチームやデータサイエンティストを構築する能力がないため、「本当に必要なデータがわからない」「どのアルゴリズムを使うべきかわからない」、「どのモデルを使えば最も正確な予測ができるのかわからない」「どのハードウェアを使えば最も低い計算コストで済むのかわからない」などの問題に直面することが多く、AI のトレーニングの精度、時間、コストが期待した結果に達しない。

この点について、MosaicML は、企業に最適なソリューションの組み合わせを提供する Explorer と、企業が(AI を)トレーニング中に遭遇する問題を解決するための Composer の2つの製品を提供している。

つまり、Explorer はコンサルタントであり、Composer はソリューションなのです。(Tang 氏)

Explorer は、XY 軸を使って計算の時間と精度を視覚的に表示し、アルゴリズム、モデル、計算ハードウェアとソフトウェアの組み合わせをその下に表示する。企業は、自分の要求をリストにチェックするだけで、Explorer は自動的に、最小リソースとコスト、最も正確な計算結果で、最適なハードウェアとソフトウェアの組み合わせを提供する。

MosaicML の製品「Explorer」は、AI トレーニングに最適なハードウェアとソフトウェアの組み合わせをビジュアルに提示する。
Image credit: MosaicML

Composer に関しては、Github 上に構築されたローコードのオープンソースシステムであり、さまざまなコードソリューションが含まれている。

例えば、企業がハードウェアにアルゴリズムを導入する際に問題が発生した場合、Composer で解決策を見つけることができる。さまざまな問題に対する解決策がすでに少なくとも30セットあり、オープンソースのフレームワークを使用することで、すべての AI 人材が独自のアイデアを提供し、共に AI トレーニングのエコシステムを向上させることも期待できます。(Tang 氏)

MosaicML を利用している顧客はまだ5社に過ぎないが、設立から1年の段階では、この程度の数を維持したいと Tang 氏は考えている。

私たちは急成長を望んでいませんし、30人のチームでは、私たちのサービスを向上させるために、より多くの人材が必要です。昨年10月の資金調達はそのためのものでした。(Tang 氏)

台湾の優秀な人材を見つけるチャンスはあるのだろうか? Tang 氏は、これも MosaicML の将来計画にとってチャンスだと考えている。

【via Meet Global by Business Next(数位時代) 】 @meet_startup

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する