Press Release

Spiral.AI、Transformerの限界を克服した次世代LLMアーキテクチャ「RetNet」の学習済みモデルを公開

Spiral.AI株式会社 2024.05.01

Spiral.AI株式会社（本社：東京都千代田区、以下「SpiralAI」）は、従来のLLMアーキテクチャであるTransformerの問題点を解決した学習済みモデルを開発・公開しました。

開発・公開したモデルは、RetNetのアーキテクチャを活用しています。RetNetは、入力文字列長が長くなっても計算時間や必要リソースが増加しない特徴を持っており、Transformerの入力文字列長が長くなると計算量が爆発的に増加する課題を解決したものとなっております。

Spiral.AIは今後もTransformerの限界を克服する次世代アーキテクチャの研究に取り組んでまいります。
公開モデルはこちら
RetNetとは現行の大規模言語モデルはTransformerと呼ばれるアーキテクチャによって構成されています。Transformerは入力文字列長が長くなると計算量が爆発的に増加する性質があるため、与えられる指示内容に制限があったり、大きな計算リソースが要求されるなどの課題を抱えていました。

この課題を解決するため、Transformerの仕組みから脱却した次世代アーキテクチャの探索が進められています。RetNetはその一つのアイデアとしてMicrosoftの研究チームにより2023年8月に提案されました[1]。

主な特徴として、入力文字列長が長くなっても計算時間や必要リソースが増加しないことが挙げられます。そのため、サーバーの計算コストを軽減させたり、エッジ推論を可能にする展望が拓けます。また、長い入力文字列長による柔軟な指示 (プロンプト) の与え方が可能になることや、長期記憶を保持することができるなど、機能的な優位性も保有します [2]。

その特徴はSpiral.AIで追求する「口語会話」のユースケースにおいて、例えばはるか昔に会話した記憶を持ち続けるなど、より人間らしい体験を提供することに繋がります。

公開の目的優れた特徴を持つRetNetですが、2024年4月現在時点で開発チームから学習済みモデルやパラメーターが公開されていません。そのため、追試や挙動の検証を行いづらく、後続の研究があまり広がっていないという課題がありました。

大規模言語モデルのコミュニティにおけるRetNetの浸透のため、Spiral.AIでは30億パラメータ級のRetNetを新規に学習させ、その学習済みパラメータを公開しました。日英のデータセットで学習させており、日英の2言語を入力することが可能です。

https://huggingface.co/Spiral-AI/Spiral-RetNet-3b-base

30億パラメータ級のモデルは、実用観点では必ずしも十分な性能ではないため、研究目的での公開となります。質疑応答タスク (QA Task) に対する学習は行っておらず、文字列補完タスク (Completion Task) 用のベースモデルの提供となります。

DGX A100を3ノードでおよそ2週間、合計80bnトークン学習しています。今後も継続的な学習を行い、より高い性能のモデルのリリースも予定しています。

今後の展開 Spiral.AIでは、Transformerの限界を克服する次世代アーキテクチャの研究を進めています。本RetNetモデルはその目的で、基礎的な性質の検証に活用する予定です。

下図はその一つの例として、RetNetが入力文字列のうちどの文字に注目しながら文章を生成しているかを可視化したものです。Transformerとは異なる原理で動作しながらも、動的に注目文字を変えている様子がわかります。このような基礎的な挙動確認を行いながら、RetNetをはじめとする次世代アーキテクチャの研究を進めていきます。

PR TIMESで本文を見る

Press Release

ゲーム『ウマ娘プリティーダービー』第二回「DMM GAMESからの4ヶ月連続ポイントバックキャンペーン」を開催！

合同会社EXNOA 2024.05.01

合同会社EXNOA（本社：東京都港区、CEO：村中悠介、URL：https://games.dmm.com/）が運営するDMM GAMESは、本日5月1日(水)より、ゲーム『ウマ娘プリティーダービー』にて「DMM GAMESからの4ヶ月連続！ポイントバックキャンペーン」２回目の開催をお知らせいたします。キャンペーン特設サイト：https://games.dmm.com/special-cp/…

PR TIMESで本文を見る

Press Release

MetaTokyoが「きゃりーぱみゅぱみゅ」の「Fortnite」オリジナルワールドをプロデュース

MetaTokyo株式会社 2024.05.01

人気楽曲も公式で使用し、新たなエンタテインメントをグローバルに提供 MetaTokyo株式会社（東京都渋谷区、代表取締役CEO 鈴木貴歩、以下「MetaTokyo」）はアソビシステム株式会社（東京都渋谷区、代表取締役中川悠介、以下「アソビシステム」とともに、Epic Games社が配信するオンラインゲーム『Fortnite』（以下、フォートナイト）上に、UEFN（Unreal Editor fo…

PR TIMESで本文を見る

Press Release

東日本大震災での悔しい経験から13年。能登半島地震被災地への水提供に貢献し、災害時にも安心・安全な水の提供を目指す「ウォーターポイント」の取り組み

ウォーターポイント株式会社 2024.05.01

＃プロジェクトの裏側　＃防災　＃防災型宅配水工場　「安心・安全な水の創造。本物にこだわる水のスペシャリスト。」をミッションに掲げるウォーターポイント株式会社。飲料水を取り扱う企業でありながら東日本大震災にて被災地に水を提供できなかったという悔しい経験から、災害時にも近隣住民に飲料水・生活用水を提供することが出来る新しいコンセプトの宅配水工場「ウォーターポイント八王子」を2022年6月に竣工致しま…

PR TIMESで本文を見る

Press Release

優秀賞に輝いた動画は渋谷の巨大ビジョンで放映される？！動物専門SNS『Tier』で「うちの子おもしろ動画選手権」を開催！

Tier 2024.05.01

クスッと笑える動画から爆笑必至の動画までTierで動物たちのおもしろ動画を大募集！株式会社Tier（本社：東京都港区、代表取締役社長：藪内健吾）が運営する動物専門SNS『Tier』は、全ての動物たちと人をつなぐコミュニティ型SNSです。この度、動物専門SNS『Tier』にて5月1日(水)～5月31日(金)までの期間、「うちの子おもしろ動画選手権」を開催することをお知らせします。 #おもしろ動画…

PR TIMESで本文を見る

Press Release

ビットキー、東京建物・日鉄興和不動産の手掛ける中規模新築オフィスビル「suito芝浦」で全館”顔認証入退館”を実現

株式会社ビットキー 2024.05.01

ニーズ高まる中規模ハイグレードビルの差別化に活用株式会社ビットキー（本社：東京都中央区、代表取締役社長 CEO：寳槻昌則、以下「ビットキー」）は、東京建物株式会社と日鉄興和不動産株式会社が開発した2024年3月竣工の新築オフィスビル「suito芝浦（以下、当ビル）」にビットキーのworkhubが導入され、顔認証入退館および来訪者の無人受付・入館に対応したことをお知らせします。 ■導入の背景ビ…

PR TIMESで本文を見る

Spiral.AI、Transformerの限界を克服した次世代LLMアーキテクチャ「RetNet」の学習済みモデルを公開

新着・ニュース

トレンド

ゲーム『ウマ娘プリティーダービー』第二回「DMM GAMESからの4ヶ月連続ポイントバックキャンペーン」を開催！

MetaTokyoが「きゃりーぱみゅぱみゅ」の「Fortnite」オリジナルワールドをプロデュース

東日本大震災での悔しい経験から13年。能登半島地震被災地への水提供に貢献し、災害時にも安心・安全な水の提供を目指す「ウォーターポイント」の取り組み

優秀賞に輝いた動画は渋谷の巨大ビジョンで放映される？！動物専門SNS『Tier』で「うちの子おもしろ動画選手権」を開催！

ビットキー、東京建物・日鉄興和不動産の手掛ける中規模新築オフィスビル「suito芝浦」で全館”顔認証入退館”を実現