AI創薬のInsilico Medicine、ジェネレーティブAIで臨床試験の第Ⅱ相から第Ⅲ相の予測に成功

SHARE:
Image credit: Insilico Medicine

臨床段階の AI 創薬企業 Insilico Medicine は、画期的な医学的マイルストーンを発表した。独自の Transformer ベースのジェネレーティブ AI ツール「inClinico」を使用して、第Ⅱ相から第Ⅲ相の臨床試験の結果を予測することに成功した。

臨床段階では、有効性の欠如、安全性の懸念、疾患やデータの複雑さといった問題が原因で、医薬品開発の失敗の約90%を占める。こうした失敗は、何兆ドルもの損失と何年もの労力の浪費につながる。この膨大な失敗率に対応するため、Insilico は第Ⅱ相臨床試験の結果を予測するジェネレーティブ AI ソフトウェアプラットフォーム inClinico を開発した。

このプラットフォームには、テキスト、オミックス、臨床試験デザイン、低分子の特性を網羅するジェネレーティブ AI とマルチモーダルデータの力を活用する様々なエンジンが組み込まれている。そのトレーニングデータには、過去7年間の55,600以上のユニークな第Ⅱ相臨床試験が含まれている。

Insilico の研究者によって開発された臨床試験確率モデルは、測定可能な成果が入手可能な前向き検証セットで、実際の臨床試験と比較検証したところ、79%という驚異的な精度を示した。

医薬品開発に革命をもたらす AI

Clinical Pharmacology and Therapeutics に掲載されたこの研究は、医薬品開発と投資の意思決定に革命をもたらす AI の可能性を示している。

同社によると、この研究で使用された AI エンジンは、臨床試験の結果を予測するために設計された inClinico システムに連携されている。この連携は臨床試験分析・計画プラットフォーム「Medicine42」の重要な構成要素である。

Insilico Medicine の創業者兼 CEO Alex Zhavoronkov 氏は、次のように VentureBeat に語った。

複雑なデータを処理・分析し、パターンを認識することに関して、AI は非常に大きなアドバンテージを提供します。機械学習と AI を使って、上市に成功した医薬品と失敗した医薬品に関する様々なデータを基にモデルを構築しました。そして、これらのモデルを予測エンジン inClinico に組み合わせました。評価された全ての第Ⅱ相試験について、inClinico は第Ⅲ相に進むための成功確率を生成します。

Alex Zhavoronkov 氏

Zhavoronkov 氏によると、検証試験は社内および製薬会社や金融機関と共同で実施され、このプラットフォームの堅牢性が実証された。準前向き検証データセットにおいて、このプラットフォームは臨床試験移行における成功と失敗を識別する能力を示す指標である ROC AUC スコア0.88という素晴らしい結果を達成した。

同社は、このプラットフォームの正確な予測を、日付スタンプ付きの仮想取引ポートフォリオでテストした結果、9ヶ月間で35%の投資収益率(ROI)を達成したとしており、重要な技術的デューデリジェンスの洞察を求める投資家にとって貴重なツールとなっている。

創薬・薬剤開発にジェネレーティブ AI を活用

Insilico の Zhavoronkov 氏によると、彼の研究グループは、clinicaltrials.gov や、製薬会社のプレスリリースや出版物などさまざまな公開情報源から、55,653件の臨床試験データから第Ⅱ相臨床試験データセットを作成したという。

このデータは、適切にラベル付けされ、注釈が付けられ、リンクされていなければならない。この作業は、生物医学の専門家、識別変換器、大規模言語モデル(LLM)によって実行される。

その後、変換システムが、最先端の「Drug and Disease Interpretation Learning with Biomedical Entity Representation Transformer(DILBERT、仮訳:生物医学的実体表現 Transformer による薬物と病気の解釈の学習)」に基づく自然言語処理(NLP)パイプラインを使用して、これらの臨床試験を薬剤と疾患にマッピングし、カンファレンス「ECIR 2021」で発表された。

Zhavoronkov 氏は、製薬業界は伝統的に、新しいアイデアや仮説を生み出すための基礎的な学術研究やセレンディピティに依存してきたと述べた。しかし、高い失敗率は、病気や生物学的メカニズムの複雑さゆえに、病気を治療するための成功する標的、特に新規の標的を特定することが非常に困難であることを示している。

洞察と治療の可能性を明らかに

Zhavoronkov 氏は、大規模で多様なデータセットの分析に AI を取り入れることで、人間にはわからない病気のメカニズムや潜在的な治療法に関する洞察を明らかにすることができると主張している。PandaOmics は inClinico の一部であり、臨床試験、薬剤、疾患情報からの膨大なデータを同化し、第Ⅱ相から第Ⅲ相への移行中の成功または失敗の可能性を予測する。

PandaOmics は、オミックスデータ、助成金、臨床試験、化合物、出版物など様々なタイプのデータを利用し、関心のある疾患に特異的な潜在的標的のランク付けされたリストを分析・作成する。

PandaOmics はターゲット同定のための知識グラフであり、私たちのジェネレーティブ AI プラットフォームは、臨床試験の成功や失敗、病状、人間の科学者を逃すかもしれない薬剤の属性間のつながりを見つけることができます。このデータを使って、私たちは第Ⅱ相臨床試験の成功確率を予測するモデルを構築しました。これは、第Ⅱ相から第Ⅲ相への薬剤条件ペアの移行として定義されます。(Zhavoronkov 氏)

予測能力の強化

Insilico Medicine は2014年以来、臨床試験、医薬品、疾患に関する inClinico のトレーニングを行ってきたと Zhavoronkov 氏は述べ、マルチモーダル LLM と他の遺伝子 AI 技術を組み合わせることで、予測能力を大幅に向上させたと強調した。

その結果、inClinico は現在、企業が研究資金と専門知識を、成功の可能性が最も高いプログラムに振り向けるための指針となる一方、挫折に直面したプログラムから貴重な情報を入手して活用することを可能にするツールとして機能している。

inClinico が、薬剤の疾患作用の臨床的関連性に関連する事前情報がなくても、成功した第Ⅱ相から第Ⅲ相への移行薬剤を予測できたことは、ジェネレーティブ AI モデルと、利用可能なデータが少ない疾患の転帰を予測するために既存のデータを基に構築する能力を検証するものです。データが多ければ多いほど、そして成功した結果が多ければ多いほど、AI は正確な予測ができるようになります。(Zhavoronkov 氏)

inClinico の次なる目標

Zhavoronkov 氏は、限られたデータセットの中で得られた知見であることを認めつつも、強い励ましを表明した。彼は、inClinico 社内のパイプラインプログラム(特発性肺線維症、癌、新型コロナウイルスの3つ)から得られた知見も含め、データの急増と強化によって、システムの洗練度と精度は時間とともに継続的に向上すると確信している。

inClinico は、inClinico ツールを使って約20~25%の治験を予測的に評価し、意味のある精度で評価できると予測している。inClinico は、新しいラボロボット工学の進歩を活用して、併用療法の成功率を予測し、標的療法に最も効果的な併用療法の選択を促進することで、その能力をさらに拡大したいと考えている。

私たちは、AI を搭載したロボット工学、アルファフォールド、量子コンピューティングなど、最先端の技術的ブレークスルーを私たちのプラットフォームに統合しています。私の壮大な目標は、このツールが広く普及することです。

私たちは、専門家のフィードバックからの強化学習(RLEF)と呼ばれるアプローチを採用しており、予測に使用するアナリストから受け取る洞察によってツールの精度が向上します。現在は、低分子のファースト・イン・クラスの単剤標的治療薬しか予測できません。(Zhavoronkov 氏)

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する