Meta、脳スキャンで心の中のイメージを描画する「Image Decoder」を発表

SHARE:
Image credit: Meta

そう遠くない未来のコンピューティングインターフェイスは、タッチスクリーンやキーボードを超えて、目や手のジェスチャーさえも超えて、私たち自身の心の中へと移行するかもしれない。

社会はまだそこに到達していないが、我々はそれに近づいている。Facebook、Instagram、WhatsApp、Oculus VR の親会社である Meta Platforms の研究者は18日、Metaのオープンソース基盤モデル「DINOv2」をベースにした新しいディープラーニングアプリケーション「Image Decoder」を発表した。

言い換えれば、Meta の研究者がある部屋に座っていて、被験者が地球の反対側にいたとしても、Image Decoder を使えば、被験者が脳活動に基づいて何を見ているか、何を想像しているかを見ることができる。被験者がニューロイメージング施設にいて、MEG 装置(脳磁計)によるスキャンを受けていればの話だが。

Facebook 人工知能研究所(FAIR)とパリの PSL 大学(パリ・シアンス & レットゥル大学)で働く研究者たちは、新しい論文の中で、彼らの研究と Image Decoder のシステムの詳細について述べている。

Meta は、広報担当者が VentureBeat に電子メールで次のように答えた。

人間の知能の基礎を理解し、現在の機械学習アルゴリズムと比較して、その類似点と相違点特定し、最終的には人間のように学習し、推論する可能性のある AI システムを構築するのに役立つという Meta の長期的な研究イニシアチブを強化するものです。

Meta「Image Decoder」の仕組み

論文の中で、Metaの研究者はImage Decoderを支える技術について述べている。

機械学習(特にディープラーニング)とは、コンピュータがラベル付けされたデータを分析することによって学習し、新しいデータを検査して正しくラベル付けしようとするものである。

Metaの研究チームは、4人の患者(女性2人、平均年齢23歳)の12セッションにわたる6万3,000件のMEG結果を対象に、ディープラーニングアルゴリズムを訓練した。

DINOv2 は、他のモデルを学習させるために設計された自己教師付き学習モデルで、Metaが2023年4月に公開した北米の森林の風景を学習させたものである。

研究者たちはImage Decoderのアルゴリズムに、生データと脳がMEG活動を起こしたときにその人が実際に見ていたもののイメージの両方を見るように指示した。

このようにして、MEGデータを実際のソース画像と比較することで、アルゴリズムは特定の形や色が脳内でどのように表現されているかを解読することを学んだ。

有望な結果と倫理的配慮

Image Decoder のシステムは完璧とは言い難いが、研究者たちは、MEG データに基づいて画像を正確に検索または再現するという点で、最も高い精度を達成したケースで70%という、既存の手法の7倍の精度を達成した結果に勇気づけられている。

Image Decoder は、ブロッコリー、イモムシ、オーディオスピーカーのキャビネットの写真など、潜在的なイメージのプールからうまく画像を取り出した。しかし、タコス、ワカモレ、豆など、より複雑で多様なイメージの解読にはあまり成功しなかった。

Meta の「Image Decoder」が、異なる MEG データを画像にデコードする際のパフォーマンスを示すグラフ。
Image credit:Meta Platforms

全体として、われわれの発見は、研究室や診療所における視覚表現のリアルタイムデコードに有望な道を示すものです。(研究者ら)

人の心の中を覗き見ることができるというのは、テクノロジーがまだ大規模に到達していない新しいレベルの侵襲性だからである。

研究者たちが提唱する倫理的配慮の中で最も注目すべきは、精神的プライバシーの保護の必要性である。

この研究が、自社製品による消費者のプライバシー侵害ですでに数十億の罰金を科せられた親会社から資金提供を受けているという事実もまた、注目すべき懸念事項であるが、研究者たちはこの問題について直接言及していない。

しかし、技術的な限界があるため、この技術を人の同意なしに人の思考を読み取るために使うことはできない。すなわち、Image Decoderはその人が見た物理的な物や光景の具体的なイメージに対して最もよく機能する。

これとは対照的に、デコーディングの精度は、表象を想像する課題を課された場合に著しく低下します。(研究者ら)

加えて、被験者が逆算のような妨害的な作業に従事している場合、デコーディングパフォーマンスは著しく低下するようである(研究者らの話)。言い換えれば、被験者の同意は法的なものであるだけでなく、脳のデコーディングのための技術的な要件でもある。

つまり、同意なしに脳活動の画像解読を受けた人は、逆算のようなテクニックに頼ることで、それを止めることができる。もし彼らがその選択肢と、彼らが置かれている状況を知っていたなら。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する