【デモあり】ELYZA、商用利用可能な130億パラメータの日本語LLM「ELYZA-japanese-Llama-2-13b」を一般公開

SHARE:

既存のオープンな日本語モデルの中で最高性能、175BのGPT-3.5 (text-davinci-003) を上回る性能を達成

 大規模言語モデルの社会実装を進める東京大学松尾研究室発・AIカンパニーの株式会社ELYZA(代表取締役:曽根岡侑也、以下ELYZA)は、商用利用可能な130億パラメータの日本語LLM「ELYZA-japanese-Llama-2-13b」を開発し、一般公開しました。 2023年8月に公開した「ELYZA-japanese-Llama-2-7b」と同様、Meta Platforms, Inc.(以下Meta)が開発した英語の言語能力に優れた大規模言語モデル(以下LLM)である「Llama 2」に対し日本語による追加事前学習とELYZA独自の事後学習を行ったモデルとなります。

PR TIMESで本文を見る