Stability AI、最小限のデータで学習させた大規模言語モデル（LLM）「FreeWilly」を公開 - BRIDGE（ブリッジ）テクノロジー＆スタートアップ情報

新しい大規模言語モデル（LLM）が登場した。「FreeWilly1」と「FreeWilly2」だ。

画像ジェネレーティブ AI「Stable Diffusion」を開発したStability AI が21日に発表した、この2つの新しい LLM は、いずれも Meta のオープンソースモデル「LLaMA」と「LLaMA 2」をベースにしているが、合成データ（アルゴリズムによって生成された、限りなく実際のデータに近い人工データ）を含むまったく新しい小規模なデータセットで訓練されている。

どちらのモデルも、複雑な推論や言語的な機微、法律や数学のような専門的な領域に関する複雑な質問に答えることに長けている。

Stability の子会社である CarperAI は、FreeWilly sを「非商用ライセンス」の下でリリースした。つまり、ビジネス目的で使用することはできず、代わりに AI コミュニティにおける研究の促進とオープンアクセスの促進を目的としている。

Orca より環境に優しい

モデルの名前は、Microsoft の研究者たちによって開発された「Orca」と呼ばれる AI のトレーニング手法をもじったもので、より小さなモデル（さらされたデータ量がより限定的）が、より巨大なデータセットにさらされた大規模基礎モデルの性能を達成することを可能にする（これは、Microsoftの研究者たちによって開発されたAIの学習方法である）。

具体的には、FreeWilly1 と FreeWilly2 は、オリジナルの Orca データセットのわずか10％である60万のデータポイントで、（機械学習エンジニアの）Enrico Shippole 氏によって作成された4つのデータセットのインストラクションを使用して学習した。これは、オリジナルの Orca モデルやほとんどの主要な LLM よりもはるかに低コストで、はるかに環境に優しい（より少ないエネルギーとカーボンフットプリントを使用）ことを意味する。このモデルは、GPT-3.5 上で ChatGPT に匹敵し、場合によってはそれを上回るという、傑出した性能を発揮した。