AIアシスタント開発のMerlyn Mind、教育現場に特化したLLMをローンチ——幻覚の発生頻度は、汎用LLMの6分の1に

AI を搭載したデジタルアシスタントプラットフォーム「Merlyn Mind」は、オープンソースライセンスの下、教育分野向けに特別に調整された大規模言語モデル（LLM）スイートのローンチを発表した。

Merlyn Mind は、教育ワークフローと安全要件に重点を置いて開発された LLM は、教師と生徒に、ユーザが選択したカリキュラムで動作する生成モデルに関与する力を与え、強化された学習体験を促進すると述べている。

教育目的で設計された同社のジェネレーティブ AI プラットフォームの一部である LLM は、教育コンテンツの特定のコレクションと対話することができる。

Merlyn Mind の CEO で共同創業者の Satya Nitta 氏は次のように語った。

教育に特化した LLM は現在までに発表されていない。いくつかの教育サービスは汎用の LLM を使用しているが（ほとんどはOpenAI と連携されている）、これらは我々が議論してきた欠点（幻覚、鉄壁の安全性の欠如、プライバシーの複雑さなど）に遭遇する可能性がある。対照的に、我々の目的のために構築されたジェネレーティブ AI プラットフォームと LLM は、教育のニーズに合わせて開発され、調整された最初のものだ。

Nitta 氏によると、典型的な LLM は膨大な量のインターネットデータに基づいて訓練され、その結果、コンテンツから生成された回答が得られる。これらの応答は、教育要件と一致しない可能性がある。対照的に、Merlyn Mind の LLM は、ユーザまたは教育機関によって選択された学術コーパスのみに依存し、広範なインターネットにはアクセスしない。

教育機関、学校の指導者、教師が、生徒を最もよく支援するために使用するコンテンツとカリキュラムについて、思慮深い戦略的な選択をするとき、Merlyn Mind の AI プラットフォームは、この現実のために構築されている。

教師と生徒は、Merlyn Mind の音声アシスタントを通じて、教育に特化したジェネレーティブ AI プラットフォームを使用することができる。教室では、ユーザは Merlyn Mind に口頭で質問したり、進行中の会話に基づいてクイズや教室での活動を生成するよう要求したりできる。

また、このプラットフォームでは、教師がカリキュラムや沿った内容に合わせたスライド、授業計画、評価などのコンテンツを生成することもできる。

幻覚を排除、正確な教育インサイトを提供

Merlyn Mind の Nitta 氏は、既存の最先端の LLM はしばしば幻覚と呼ばれる不正確な反応を生成すると指摘した。例えば、OpenAI の「GPT-4」は、以前のものより改善されているにもかかわらず、まだ約20％の確率で幻覚を経験する。

同氏は、ユーザからのプロンプトは特定のコンテンツソースから引き出す必要があるため、教育においては正確で正確な応答が重要であると強調した。同社は、信頼できる正確な応答を保証し、幻覚を最小限に抑えるためにさまざまな技術を採用している。

ユーザが質問をしたり、評価を生成するコマンドを発行するなどのリクエストを送信すると、LLM はまず、学区や教育者が教育に使用しているコンテンツから最も関連性の高い文章を検索する。このコンテンツは言語モデルに提示される。

モデルは提供されたコンテンツのみに基づいて応答を生成し、事前学習教材から引き出すことはあらない。レスポンスの正確性を確認するため、別の言語モデルによる追加チェックを受け、元のリクエストとの整合性を確認する。

Merlyn Mind は、一次モデルを微調整し、高品質の応答を生成できない場合、偽の応答を生成するのではなく、失敗を認めるようにしたと述べた。

幻覚のない応答は、出典資料への帰属を伴うため、教育や学習における情報の神聖さを保持する必要性に見合ったものだ。我々のアプローチでは、幻覚を見るのは3％未満であることがすでに示されており、我々の目標であるほぼ100％の幻覚のない回答への道のりは順調だ。（Nitta 氏）

プライバシー、コンプライアンス、効率性

同社は、厳格なプライバシー基準を遵守し、教育環境に特有の法的、規制的、倫理的要件の遵守を保証していると述べた。これらには、FERPA（家族の教育の権利とプライバシーに関する法律）、COPPA（児童オンラインプライバシー保護法）、GDPR（EU 一般データ保護規則）、およびアメリカの関連する学生データプライバシー法が含まれる。Merlyn Mind は、個人情報が決して販売されないことを明確に保証する。

我々は、会話体験や書き起こしから検出された個人を特定できる情報（PII）を選別し、削除している。当社のポリシーでは、音声書き起こしの作成から6ヶ月以内、または顧客契約の終了から90日以内のいずれか早いほうの期間内に、音声書き起こしのテキストを削除する。我々は、書き起こしから得られた個人を特定できないデータを、我々のサービスの改善やその他の合法的な目的のためにのみ保持し、使用する。

同社は、教育に焦点を当てた LLM は、汎用モデルよりも小規模で効率的であると述べている。Merlyn Mind のモデルは、60億から400億のパラメータで構成され、主流の汎用モデルは通常1,750億を超える。

Nitta 氏はまた、LLM が汎用モデルと比較して、学習と操作（推論）において高い効率を示すことを強調した。

Merlyn Mind の LLM の平均待ち時間は、生成された単語あたり約90ミリ秒であるのに対し、汎用　LLM は250ミリ秒以上だ。LLM または複数の LLM をユーザのクエリに応答するために連続して使用する必要がある場合、これは非常に大きな利点になる。1,750億パラメータ（モデル）を3回連続して使用すると、不合理なほど長い待ち時間が発生し、ユーザ体験が低下し、コンピューティング資源の使用効率が大幅に低下する。

教育における LLM のチャンス

Nitta 氏は、ジェネレーティブ AI は教育を変革する大きな可能性を秘めていると述べた。しかし、安全性と正確性を最優先し、正しく使用されなければならない。

開発者コミュニティがモデルをダウンロードし、ソリューションの一部として LLM の応答の安全性をチェックするために使用することを期待している。音声アシスタントに加え、Merlyn Mind はマルチモーダル（整列画像を含む）に応答する使い慣れたチャットボットインターフェースで利用可能であり、API を通じて Merlyn Mind を利用可能にするよう要請も受けている。技術指向のユーザのために、我々はまた、オープンソースに我々の教育 LLM の一部を寄贈している。

Nitta 氏は、他の AI の進歩と同様に、教育などの特定の業界内で最もインパクトのあるソリューションは、チームが意図的に AI 技術を開発するときに台頭すると表明した。

これらのプラットフォームやソリューションは、ドメイン固有のワークフローやニーズを深く認識し、特定のコンテキストやドメイン固有のデータを理解するようになる。これらの条件が満たされたとき、ジェネレーティブ AI は産業やセグメントを完全に変革し、生産性の計り知れない向上をもたらし、人間が最高の潜在能力を発揮できるようになる。

【via VentureBeat】 @VentureBeat

【原文】