生成AIと企業内データでファインチューニングするツールの開発会社 米国Anote, Inc.と、チャネルブリッジが国内総販売代理店として提携し国内販売を開始

SHARE:

社内機密データをFew-Shot Learningのファインチューニングツールで、大規模言語モデル(LLM)の精度を格段に向上させることが可能に。

AI分野における海外スタートアップの国内事業支援を行う“株式会社チャネルブリッジ”は、本日、米国ニューヨークのAIスタートアップAnote, Inc.の日本国内総販売代理店として日本国内での販売を開始します。
企業・官公庁・研究所・大学病院等での組織内に蓄積された膨大な文書データと、大規模言語モデル(LLM)との組み合わせで精度高いLLMからの回答を得るために、Few-Shot
Learning技術によるファインチューニングを行うためのツール「Anote Data Labeler」の国内販売を開始します。

●生成AIの課題に対して
現在、生成AIはビジネスや様々な業務分野に革命をもたらし始めており、今後さらに多くの専門分野での活用が見込まれています。特に、組織内の固有のニーズに合わせたAIのカスタマイズが、今後の様々な業務の生産性向上を促進することから、RAG(Retrieval-Augmented Generation)の活用が進んでいます。しかしながら、業種・業務・組織での特定のユースケースやタスクにおいては、AIが事実に基づかないもっともらしい嘘を生成してしまうハルシネーションという現象が組織内での活用の課題にもなっています。これまでは目的に特化した高い精度のAIモデルにするためには、モデル自体を更に学習させる"ファインチューニング"*を行う必要があるものの、容易な作業ではありませんでした。

*ファインチューニングとは、企業内で大規模なAIモデルを適用したい場合に、想定タスクに関連する追加データをモデルに与え、そのタスクをこなせるようにカスタマイズするアプローチ手法の一つです。事前学習したLLM(大規模言語モデル)を別のデータセットで再トレーニングし、新しい目的に合わせた調整を行う事で、特定のタスクでの生成AIの精度向上が可能となります。

従来のラベリングツールでは、LLMのチューニングには長期間を要するラベリング(アノテーション)作業に多大な工数と高いコストが必要でした。また、多くの人手を必要とするラベリング作業では、誤ったラベリング結果がLLMの高いポテンシャルを十分に引き出せず、生成AIによるプロジェクトの失敗に繋がることもありました。

●Anote Data Labelerとは
「Anote Data Labeler」は、HCAI(Human-Centered AI)の考え方を基に、最新の自然言語処理技術とFew-Shot Learningに基づくファインチューニング機能を搭載しています。これにより、わずかな学習データでドメイン特化型のLLMからの回答精度を大幅に向上させることが可能になります。またユーザーからのフィードバックを取り入れつつ精度を高める機能が、生成AIの精度向上と、今後のより一層の組織内での生成AIの展開に期待が高まっています。

企業を始め、多くの組織でLLMの活用が急速に進む中、Anote Data Labelerの登場により、組織内の機密データを保護しながら、専門家の少量のラベリングで残りの文書に自動的にラベリングを行うことが可能になり、LLMの活用領域を大きく拡大できるようになります。

PR TIMESで本文を見る