ビッグデータと機械学習を薬の発見に利用するGoogle

by Paul Sawers Paul Sawers on 2015.3.10

dena-featuredimage
via Flickr by Josh*m. Licenced under CC BY-NC-SA 2.0

検索結果に表示される健康関連の質問に対して回答するといったことから、開発者向けのフィットネスデータプラットフォームに至るまで、日常生活に織り込まれている健康や幸福にGoogleが深く入り込んできている。しかし一方で同社は、人間の多数の病に対する治療法を見つける上で不可欠となる薬の発見を促進させる取り組みも進めている。

Google Researchがスタンフォード大学の Pande Labと協力し、『Massively Multitask Networks for Drug Discovery』(ネットワークの大規模マルチタスク化による薬剤発見)[PDF]という論文を発表した。「多種多様な病気に有効な薬物治療」として機能を果たす化合物は何か、ということに関してより良い決定を下すには、無数の様々な情報源のデータ利用が役立つと考察している。

論文自体が医学的に大きなブレイクスルーを明らかにしているわけではないが、膨大なデータセットを高速処理したり、薬剤の発見を加速させたりするためにディープラーニング(深層学習)を使う方法を提示している。

入力した重要データから導き出した大量の情報を複数の人工ニューラルネットワーク(人工神経回路網)という組織網が網羅しているが、ディープラーニングとはその組織網を教育し、その組織網の混合に新情報を導入するシステムである。2015年に注目すべき5つの深層学習スタートアップを記事で紹介しているので、そちらも参照してほしい。

共著のGoogle Researchブログ投稿では、次のように説明されている。

この研究の結論として心強いことの1つが、様々な実験から得られたデータを病気の予測精度向上に役立てることができるという点です。私たちの知る限り、この分野でデータを追加することの効果が数値化されたのは初めてのことです。そして今回の結果から、データをさらに追加していくことで、さらなるパフォーマンスの向上が見込まれると出ています。

Googleは「今までの18倍以上」の効果があると述べ、200以上の生物学的過程で合計3780万点のデータを取り出したとしている。

研究の規模が大きかったため、それらのモデルについて、モデル構造や入力データを多様に変化させた場合の感度を注意深く精査することができました」とGoogleは述べる。「論文では、モデルのパフォーマンスを調査するだけではなく、なぜそれがうまく機能するのか、将来同じようなモデルがあった場合、何が期待できるかについても分析しました。

今回の件は、ここ最近の大きな流れを後押しするものだ。大手テック系企業の多くがディープラーニングに投資しているという流れで、Twitter、Google、Yahooは昨年それぞれディープラーニング関連のスタートアップを買収し、FacebookとBaiduはこの分野に多くの人材を雇い入れた。NetflixとSpotifyもまた、この分野の事業に乗り出している。

VentureBeatが主催した昨年10月のHealthBeatカンファレンスで、私たちはヘルスケアが将来、ロボット工学、アナリティクス、人工知能(AI)にどれほど多く頼ることになるかについて考察した。Googleとスタンフォード大学によるこの最新の研究を見てもわかるように、診断的要素から治療法を発見するにあたり、ますます人工知能やビッグデータ、ディープラーニングが注目されてきている。

このことは自動化と予測技術の改善により、医薬品の発見プロセスをスピードアップするだけでなくコストも削減することになるだろう。Googleのレポートは以下のように述べている。

人間の病気に対して新しい治療法を発見することは、非常に複雑な課題だ。医薬品として有望な物質は病因を攻撃しなければならないのはもちろん、代謝や毒性に対する制限も同時に満たす必要がある。従来から医薬品の発見は、始めから終わりまで何年もかかるような長い期間を要するプロセスだ。また、その途中で失敗に終わる率も高い。

要するに、何百万もの化合物をテストするには長い時間がかかる。だから、うまくいく組み合わせに当たる機会が増えれば増えるほどいいのだ。大規模な機械学習が活躍できる可能性があるのは、そこである。

【via VentureBeat】 @VentureBeat

【原文】

ニュースレターの購読について

毎日掲載される記事の更新情報やイベントに関する情報をお届けします!

----------[AD]----------