MIT、人間のパイロットの見落としを補う「Air-Guardian」を開発——既存AIを凌駕する基礎技術「LNN」とは

SHARE:
Image by DCStudio on Freepik

マサチューセッツ工科大学(MIT)の科学者らは、ディープラーニング(深層学習)システム「Air-Guardian」を開発した。このAI コパイロットは、人間のパイロットが危機的状況を見落としたときにそれを検知し、潜在的な事故を防ぐために介入することができる。

Air-Guardian のバックボーンは、MIT コンピュータ科学・人工知能研究所(CSAIL)が開発した新しいディープラーニングシステム「LNN(Liquid Neural Networks)」だ。LNN はすでにさまざまな分野でその有効性が実証されている。特に、計算効率が高く、説明可能なAIシステムを必要とする分野では、現在普及しているディープラーニングモデルに代わる有効な選択肢となる可能性があり、その潜在的なインパクトは大きい。

注意力の追跡

Air-Guardian は飛行の安全性を高めるためにユニークな方法を採用している。人間のパイロットの注意力と AI の集中力の両方を監視し、両者が一致しない場合を特定する。人間のパイロットが重要な点を見落とした場合、AI システムが介入し、その特定の飛行要素を制御する。

この人間参加型(ヒューマンインザループ)システムは、パイロットの制御を維持しつつ、AI がギャップを埋められるように設計されている。

MIT CSAIL の AI 科学者で、Air-Guardian 論文の共著者 Ramin Hasani 氏は語った。

このアイデアは、人間と協力できるシステムを設計することです。人間が何かをコントロールするために困難に直面した場合、AI が助けることができる。そして、人間が得意とすることについては、人間がそれを続けることができます。

例えば、飛行機が地面の近くを飛行しているとき、重力の影響でパイロットが意識を失う可能性がある。そのようなシナリオでは、Air-Guardian が引き継ぎ、事故を未然に防ぐことができる。その他の状況では、人間のパイロットはスクリーンに表示される過剰な情報に圧倒されるかもしれない。この場合、AI がデータを選別し、パイロットが見逃しているかもしれない重要な情報をハイライトすることができる。

Air-Guardianは視線追跡技術を使って人間の注意をモニターし、ヒートマップを使って AI システムの注意がどこに向けられているかを示す。両者の間に乖離が検出されると、Air-Guardian は AI が直ちに注意を払う必要がある問題を特定したかどうかを評価する。

安全第一のシステムのための AI

Air-Guardian は、他の多くの制御システムと同様に、深層強化学習モデルに基づいて構築されている。このモデルでは、ニューラルネットワークを搭載した AI エージェントが、環境観察に基づいて行動を起こす。このエージェントは、正しい行動をとるたびに報酬を与えられ、ニューラルネットワークが徐々に、与えられた状況下で正しい判断をするよう導くポリシーを学習していく。

しかし、Air-Guardian を際立たせているのは、その中核にある LNN だ。LNN は説明しやすいことで知られており、エンジニアがモデルの意思決定プロセスを掘り下げることができる特徴を持っている。これは、その不可解な性質のためにしばしば「ブラックボックス」と呼ばれる従来の深層学習システムとは対照的である。

安全第一のアプリケーションでは、通常のブラックボックスを使うことはできません。(Hasani 氏)

Ramin Hasani 氏
Image credit: MIT CSAIL

Hasani 氏は2020年、LNN の研究を開始したチームの一員だった。2022年、LNN に基づく効率的なドローン制御システムに関する彼らの研究は、「Science Robotics」の表紙を飾った。現在、彼らはこの技術を実用化するために邁進している。

LNN のもうひとつの重要な特性は、データ内の因果関係を学習する能力だ。従来のニューラルネットワークは、データ内の誤った相関関係や表面的な相関関係を学習することが多く、実世界に導入された場合、予期せぬエラーにつながる。一方、LNN はデータと相互作用して反事実的なシナリオをテストし、因果関係を学習することができるため、実世界の設定においてより堅牢になる。

タスクの真の目的を学びたいのであれば、視覚入力から統計的な特徴を学ぶだけではだめです。原因と結果を学ばなければならないのです。(Hasani 氏)

エッジデバイスのための AI

LNN には、もうひとつ大きな利点がある。従来のディープラーニングネットワークとは異なり、LNN ははるかに少ない計算ユニット(ニューロン)で複雑なタスクを学習することができる。このコンパクトさにより、処理能力やメモリーが限られたコンピュータでも動作することができる。

今日、AI システムでは、規模を拡大するにつれて、より強力になり、より多くのタスクをこなせるようになる。しかし、問題のひとつは、エッジデバイスに導入できないことです。(Hasani 氏)

MIT CSAIL チームは以前の研究で、わずか19個のニューロンを持つ LNN が、古典的なディープニューラルネットワークでは通常10万個のニューロンを必要とするタスクを学習できることを実証した。このコンパクトさは、自動運転車、ドローン、ロボット、航空などのエッジ・コンピューティング・アプリケーションにとって特に重要だ。これらのシナリオでは、AI システムはリアルタイムの決定を下す必要があり、クラウドベースのモデルに頼ることはできない。

LNN のコンパクトさは、間違いなく役に立ちます。自動車や飛行機、エッジデバイスには無限の演算能力があるわけではないからです。(Hasani 氏)

Air-Guardian と LNN の幅広いアプリケーション

Hasani 氏は、Air-Guardian の開発から得られた知見は、AI アシスタントが人間と協力しなければならない多くのシナリオに適用できると考えている。これは、複数のアプリケーションにまたがるタスクを達成するような単純なシナリオや、自動手術や自動運転のような、人間と AI の相互作用が絶え間なく続く複雑なタスクである可能性がある。

このようなアプリケーションは、多くの分野にわたって一般化することができます。(Hasani 氏)

LNN はまた、大規模言語モデル(LLM)の台頭によって大きな成長を遂げた分野である自律型エージェントの急成長トレンドにも貢献する可能性がある。LNN は、バーチャル CEO のような AI エージェントに力を与えることができるだろう。バーチャル CEO は、人間の価値観や議題と一致させながら、人間相手に意思決定を行い、説明することができる。

LNN は、普遍的な信号処理システムです。ビデオ、音声、テキスト、金融時系列、医療時系列、ユーザ行動など、入力データの種類は問いません。逐次性の概念を持つものであれば何でも、LNN の中に入れることができ、ユニバーサル信号処理システムはさまざまなモデルを作ることができます。アプリケーションは、予測モデリングから時系列、自律型、ジェネーティブ AI アプリケーションまで多岐にわたります。

Hasani 氏は、LNN の現状を、影響力のある「Transformer 論文」が発表される直前の2016年になぞらえている。Transformer は長年の先行研究の上に構築され、最終的に「ChatGPT」のような LLM のバックボーンとなった。今日、我々は LNN で実現できることの夜明けを迎えており、スマートフォンやパソコンなどのエッジデバイスに強力な AI システムをもたらす可能性がある。

Hasani 氏は次のように断言した。

これは新しい基盤モデルです。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する