文章解析AIのストックマーク、「幻覚」を抑制した130億パラメータの独自LLMをオープンソース公開

SHARE:
Image credit: Stockmark

※この記事は英語で書かれた記事を日本語訳したものです。英語版の記事はコチラから

企業向け文章解析 AI を開発・提供するストックマークは27日、「AWS LLM 開発支援プログラム」を活用し、日本語単独としては最大規模となる130億パラメータを持った LLM「Stockmark-13b」を公開した。元にするデータには、同社が独自に収集しているビジネスに関連するオープン情報や特許情報なども含まれるため、ビジネス上の質問に対し「ハルシネーション(幻覚)」を抑制し、他の LLM よりも高精度な回答が期待できるという。また、ChatGPT と比較して、テキスト生成が約4倍の速度で回答できる。

ストックマークでは8月にも、LLM の学習ライブラリ「GPT-NeoX」をベースとした14億パラメータを持った日本語 LLM「gpt-neox-japanese-1.4b」を公開している。その後、2023年9月に AWS LLM 開発支援プログラムに採択され、AWS 独自の AI アクセラレータ「Trainium」を活用し、高精度で高速に業務上で知りたい疑問に回答可能な LLM の開発を進めてきた。同社では今後、新規事業開発や用途探索、技術開発などの特定の業務ユースケースにおいて、実務で活用できる LLM の構築を目指すとしている。

ストックマークは2016年4月、日本の大手商社に勤務していた林達氏をはじめ、技術者4人が中心となって設立された。国内外のサイトからのオープンニュースのレコメンドと構造化により各種サービスを開発、現在、事業者向けのニュースクリッピング「Anews(エーニュース)」、ビジネスニュースを構造化解析し市場動向や競合の動きを可視化できる「Astrategy(エーストラテジー)」 を展開している。日経225にノミネートされる企業の約25%がストックマークの製品を利用しているという。

via PR TIMES    Summarized by ChatGPT

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する