IBMとNASA、共同開発した地理空間基盤AIモデルをHugging Face上でオープンソース公開

SHARE:
Image credit: IBM

Hugging Face 上で利用可能なオープンソースのモデルはたくさんあるが、8月3日にもう1つ加えられた。

IBM と NASA は3日、地理空間基盤モデル「watsonx.ai」をHugging Face で利用可能にしたことを共同で発表した。このモデルの開発は、気候科学を発展させ、地球上の生活を改善するために、膨大な衛星画像の価値を解き放つ試みとして、2月に初めて公開された。オープンモードは、NASA の衛星データ「Harmonized Landsat Sentinel(HLS)」で学習され、火災跡や洪水マッピングなど、いくつかの特定のユースケースのためにラベル付けされたデータを使用してさらに微調整された。

地理空間基盤モデルは、IBMが watsonx.ai の取り組みのために開発してきたエンタープライズテクノロジーの恩恵を受けており、新しいモデルで開拓されたイノベーションが科学とビジネスの両方のユースケースに役立つことを期待している。

IBM Research AI 担当副社長 Sriram Raghavan 氏は、VentureBeat に次のように語っている。

基盤モデルを使えば、多くの事前学習を行った上で、簡単に適応させ、生産性と展開を加速させることができます。

大規模なデータラベリングは難しい

Sriram Raghavan 氏
Image credit: IBM

IBMのエンタープライズユーザがこれまで AI で直面してきた主な課題は、学習には非常に大量のラベル付きデータが必要だったことだ。基礎モデルはそのパラダイムを変える。

基礎モデルでは、AI はラベル付けされていない大規模なデータセットで事前に訓練される。その後、特定のユースケースのための微調整を、ラベル付きデータを使って実行することで、非常にカスタマイズされたモデルを得ることができる。モデルがカスタマイズされるだけでなく、IBM と NASA は、基礎モデルのアプローチを使用することで、完全にラベル付けされたデータで構築されたモデルを使用するよりも、より迅速なトレーニングと優れた精度が可能になることを発見した。

例えば、洪水モデルの予測というユースケースにおいて、新しい基礎モデルは、ラベル付けされたデータの量が2分の1であるにもかかわらず、最新技術よりも予測を15%向上させることができたと Raghavan 氏は言う。

SME(Subject Matter Expert)がやらなければならないことは、基本的に半分で済むということです。つまり、教師なし方式で学習させたベースモデルを使い、SME が洪水(予測)のやり方を教えます、と言えば、他の技術で使わなければならなかったラベル付きデータの半分の量で済むということです。(Raghavan 氏)

広大な土地で山火事が猛威を振るう時代に、ますます重要性を増している火災跡のユースケースにおいて、IBM はさらに大きなメリットを認識した。Raghavan 氏によれば、IBM のモデルは、現在の最先端モデルよりも75%少ないラベル付きデータでモデルを学習させることができ、彼によれば、二桁の性能向上を実現したという。

オープンな地理空間基盤モデルにとって、Hugging Face はなぜ重要なのか

なぜ IBM と NASA が Hugging Face でこのモデルを利用できるようにしたのかについては、多くの理由があると Raghavan 氏は言う。

ひとつは、Hugging Face がオープン AI モデルの主要コミュニティになっていることだ。これは、IBM が今年初め、基礎モデル構築のための watsonx.ai アプローチを初めて発表した際に認識したことだ。最初の発表の一環として、IBM は Hugging Face と提携し、IBM のエンタープライズユーザにオープン AI モデルへのアクセスを提供した。

IBM と NASA は、Hugging Face で地理空間基盤モデルを利用できるようにすることで、このモデルが利用され、時間の経過とともに改良に役立つ教訓が得られることを期待している。

Raghavan 氏は、このモデルを Hugging Face の API と互換性を持たせることで、開発者は既存のさまざまなツールを利用して、このモデルを利用することができると語った。

その目的は、聴衆の労力を減らすことであり、ここでの聴衆は、衛星データの上で仕事をしようとする科学者です。今日、Hugging Face API は、親しみやすさという点で、エコシステムを支配しています。(Raghavan 氏)

エンタープライズユーザは、最終的にどのような恩恵を受けるのか

地理空間基盤モデルの中心的な利用者は科学者だが、Raghavan 氏は企業における AI の利用事例にも役立つ学習が得られるであろうと期待している。

直接的な影響という点では、IBM には環境インテリジェンススイートがあり、今日さまざまなモデルを使用して、組織の持続可能性への取り組みを支援している。Raghavan 氏は、新しいモデルはやがてそのプラットフォームと連携されるだろうと述べた。

また、Raghavan 氏が「メタ学習」と呼ぶ、学んだ教訓が IBM の AI 開発の他の分野に影響を与える可能性もある。

我々は、基礎モデルの開発者がどのような経験をするのかを理解する旅の途中だと考えています。これらのモデルのファインチューニングを行うことになる科学者たちとともに新しいユーザ層を公開することで、我々はそのプロセスをより良くするために何を提供すべきかを理解し始めるでしょう。(Raghavan 氏)

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する