Sakana AI の脅威的な「進化的アルゴリズム」とは

SHARE:

東京のスタートアップ Sakana AI(サカナエーアイ)が開発した新しい手法 Evolutionary Model Merge は、自然選択のプロセスに着想を得て、既存のモデルの部分を組み合わせることで、より優れた生成モデルを自動的に作成するものだ。

Sakana AI は、2023年8月に その存在を発表 した。共同創設者には、元 Google(グーグル)社員の David Ha(デイビッド・ハ)氏や、現在の生成 AI 時代の幕開けとなった論文 “Attention Is All You Need” の共著者である Llion Jones(リオン・ジョーンズ)氏などの著名な AI 研究者が名を連ねている。

Sakana の新しい Evolutionary Model Merge 手法により、開発者や組織は、費用対効果の高い方法で新しいモデルを作成・発見できるようになり、独自のモデルのトレーニングやファインチューニングに莫大な費用をかける必要がなくなるのだ。

Sakana は、Evolutionary Model Merge によって作成された大規模言語モデル (LLM) とビジョン言語モデル (VLM) をリリースした。

生成モデルを「合体(マージ)」させる

生成モデル のトレーニングは、高価で複雑なプロセスであり、ほとんどの組織には手が出ないものだ。しかし、Llama 2Mistral などのオープンモデルのリリースにより、開発者は低コストでモデルを改善する革新的な方法を見出している。

その方法の1つが「モデルマージ」だ。2つ以上の事前学習済みモデルの異なるコンポーネントを組み合わせて、新しいモデルを作成する手法である。正しく行えば、マージされたモデルは、ソースモデルの長所と能力を継承できる可能性がある。

興味深いことに、マージされたモデルは追加のトレーニングを必要としないため、非常に費用対効果が高い。実際、Open LLM リーダーボードの上位モデルの多くは、人気のベースモデルをマージしたバージョンなのだ。

Sakana AI の研究者たちは、同社の ブログ でこう述べている。「私たちが目にしているのは、研究者、ハッカー、愛好家、アーティストなど、大勢のコミュニティが、既存のモデルを専門的なデータセットでファインチューニングしたり、既存のモデルを組み合わせたりして、独自の方法で新しいファンデーションモデルを開発していることだ」。

Hugging Face には50万以上のモデルが存在しており、モデルマージは、研究者、開発者、組織にとって、非常に低コストで新しいモデルを探索・作成する幅広い可能性を提供する。しかし、モデルマージは直感とドメイン知識に大きく依存している。

モデルマージの革新性

Sakana AI の新しい手法は、効率的なモデルマージを発見するためのより体系的なアプローチを提供することを目的としている。

Sakana AI の研究者たちは次のように述べている。「私たちは、自然選択に着想を得た進化的アルゴリズムが、より効果的なマージソリューションの扉を開くと信じている」。

進化的アルゴリズムとは、生物の進化プロセスに着想を得た、集団ベースの最適化手法だ。既存の個体群の要素を組み合わせて候補解を反復的に生成し、適応度関数によって最良の解を選択する。進化的アルゴリズムは、従来の方法や人間の直感では見落とされるかもしれない、新規性のある直観に反する組み合わせを発見しながら、膨大な可能性の空間を探索できる。

Sakana AI 創設者の David Ha 氏は VentureBeat に次のように語った。

「既存の多様なモデルから、新たな創発的能力を持つ新しいモデルを進化させる能力は、重要な意味を持つ。ファンデーションモデルのトレーニングにかかるコストとリソース要件が高まる中、豊かなオープンソースエコシステムにある多様なファンデーションモデルを活用することで、大企業や政府は、完全にカスタムモデルを一から開発するために多額の資本を投じたり、国のリソースを活用したりする前に、より安価な進化的アプローチを検討し、プロトタイプモデルを迅速に開発できるだろう」。

Sakana AI の Evolutionary Model Merge は、進化的手法を用いて、異なるモデルを組み合わせる最良の方法を発見する、汎用的な手法だ。人間の直感に頼るのではなく、既存のモデルのレイヤーと重みを自動的に組み合わせ、新しいアーキテクチャを作成・評価する。

Credit: Sakana AI

Sakana のブログによると、「既存のオープンモデルの膨大な集合知を活用することで、私たちの手法は、ユーザーが指定した望ましい能力を持つ新しいファンデーションモデルを自動的に作成できる」のだそうだ。

進化的マージの実際

手動で作成されたマージモデルの目覚ましい進歩を考えると、研究者たちは、進化的アルゴリズムがオープンソースのファンデーションモデルの大きなプールを組み合わせる新しい方法を見つけるためにどこまで行けるのかを確かめたいと考えた。

その結果、Evolutionary Model Merging は、非英語言語と数学、非英語言語とビジョンなど、まったく異なるドメインの異なるモデルをマージする自明ではない方法を発見したのだ。

研究者たちは次のように述べている。「私たちのアプローチをテストするために、最初は、数学的推論が可能な日本語の大規模言語モデル (LLM) と、日本語のビジョン言語モデル (VLM) を自動的に進化させるための手法をテストした」。

その結果得られたモデルは、明示的に最適化されていないにもかかわらず、いくつかの LLM およびビジョンベンチマークにおいて最先端の性能を達成した。LLM については、進化的アルゴリズムを使用して、日本語 LLM の Shisa-Gamma と、数学特化型 LLM の WizardMath と Abel をマージした。

70億パラメータの日本語数学 LLM である EvoLLM-JP は、いくつかの日本語 LLM ベンチマークで高い性能を発揮し、一部の最先端の700億パラメータ日本語 LLM をも上回った。

研究者たちは、「私たちの実験的な日本語数学 LLM は、汎用的な日本語 LLM としても十分に優れていると考えている」と述べている。

日本語 VLM については、人気のオープンソース VLM である LLaVa-1.6-Mistral-7B と Shisa-Gamma 7B を使用した。その結果得られた EvoVLM-JP は、LLaVa-1.6-Mistral-7B だけでなく、既存の日本語 VLM である JSVLM をも上回るスコアを達成した。彼らは両方のモデルを Hugging Face と GitHub でリリースした。

このチームは、進化的モデルマージ手法を画像生成 拡散モデル に適用することでも進展を見せている。日本語のプロンプトで高品質の結果を出し、非常に高速に画像を生成できる新バージョンの Stable Diffusion XL を作成中だ。

Ha 氏は次のように述べた。「リリースの数日前に EvoSDXL-JP の結果が出たばかりなので、そのモデルの適切なリリースや記事はまだ書けていない。うまくいけば、1~2か月以内にリリースできるだろう」。

Sakana AI のビジョン

Stability AI の元研究責任者で元 Google Brain 研究者の Ha 氏は、生成モデルで使用される Transformer アーキテクチャ を紹介した画期的な2017年の研究論文の共著者の1人である Llion Jones 氏とともに、Sakana AI を設立した。

Sakana AI は、進化や集合知など自然界に着想を得たアイデアを応用し、新しいファンデーションモデルを作成することに注力している。研究者たちはこう述べている。

「AI の未来は、膨大なエネルギーを必要とする単一の巨大な全知の AI システムではなく、それぞれがニッチで専門性を持ち、互いに相互作用する小さな AI システムの広大なコレクションで構成されるだろう。そして、特定のニッチを埋めるために新しい AI システムが開発されるのだ」。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する