OpenAI、「GPT-3.5 Turbo」のファインチューニングに対応——企業ユーザが回答のトーンや言語を統一可能に

SHARE:
Image credit: OpenAI

ジェネレーティブAIで 社内のワークフローを強化しようとする企業が増える中、OpenAI はその実装をより良いものにしようと取り組んでいる。Sam Altman 氏率いる OpenAI の最新の動きは、大規模言語モデル(LLM)「GPT-3.5 Turbo」をファインチューニング(既に学習済のモデルに新たな層を追加し、モデル全体を再学習する方法)するための新しいビルトインサポートをユーザに提供することだ。

この開発により、企業はモデルをトレーニングするために独自のデータを持ち込み、それを大規模に実行することができるようになる。このカスタマイズにより、2021年9月までの公開データで事前にトレーニングされた GPT-3.5 Turbo は、ビジネス特有のユースケースをよりうまく処理できるようになり、GPT-3.5 Turbo を導入するユーザや組織ごとにユニークで差別化された体験を生み出すことができるようになる。

GPT-3.5 Turbo は 、ChatGPT を通じて消費者が直接無料で利用できるモデルの1つだが、有料の API コールを通じて、その製品から独立して使用することもでき、企業はそれを自社の製品やサービスに連携できる。

OpenAI によると、初期のテストでは、カスタムチューニングされた GPT-3.5 Turbo は、特定の狭いタスクにおいて、フラッグシップの「GPT-4」と同等か、それを上回ることさえできるという。GPT-3.5Turbo はこの秋にファインチューニングのために公開される予定だ。

GPT-3.5 Turbo のファインチューニングに期待すること

OpenAI がブログポストで書いているように、企業データで事前に訓練された GPT-3.5 Turbo をファインチューニングすることで、企業の開発者はモデルからのより良い指示フォローなど、一定の利点を得ることができる。

例えば、その言語でプロンプトが表示されるたびにドイツ語で応答するようにカスタマイズすることもできる。また、指定されたコードスニペットを完成させるなど、指定された方法で回答をフォーマットしたり、特定のブランドの声に沿った特定のトーンで回答を提供するように調整することもできる。

これ以外にも、OpenAI はカスタマイズによって、企業がプロンプトを短縮し、API コールを高速化すると同時に、コストを削減することができると主張している。初期のテストでは、開発者はモデル自体に指示をファインチューニングすることで、プロンプトのサイズを最大90%削減することができた。

GPT-3.5 Turbo は、GPT-3.5 ファミリーの中で最も高性能かつコスト効率に優れたモデルで、従来の補完タスクだけでなく、チャット補完 API を使用したチャットにも最適化されているという。このモデルのファインチューニングバージョンは、一度に 4,000トークンを処理することができ、これはファインチューニングが可能な以前の GPT-3 モデルの2倍であるとしている。

OpenAI でファインチューニングする方法

OpenAI のブログによると、ファインチューニングには主に3つのステップがある。データの準備、ファイルのアップロード、ファインチューニングジョブの作成だ。ファインチューニングが終了すると、そのモデルは、基礎となるモデルと同じ共有レート制限で、プロダクションで使用できるようになる。

ファインチューニングの展開が安全であることは、我々にとって非常に重要です。ファインチューニングプロセスを通じてデフォルトモデルの安全機能を維持するために、ファインチューニングトレーニングデータは、我々の安全基準に抵触する安全でないトレーニングデータを検出するために、我々のモデレーション API と GPT-4 を搭載したモデレーションシステムを経由して渡されます。(OpenAI ブログ)

同社はまた、ファインチューニング API とシステムから送受信されるデータはユーザが所有するものであり、顧客自身のモデル以外に(OpenAI や他の企業の)いかなるモデルのトレーニングにも使用されないことを強調している。

価格については、OpenAI は GPT-3.5 Turbo のトレーニングに1000トークンあたり0.0080ドル、インプットの使用に1000トークンあたり0.0120ドル、アウトプットに1000トークンあたり0.0120ドルを課している。

GPT-4 へのファインチューニング、その他の近日公開予定

今後、OpenAI は、画像も理解できる代表的な生成モデル GPT-4を 、ファインチューニングのために公開する予定だ。目標は今秋以降だという。

さらに、ファインチューニングプロセス全体を改善するために、同社はファインチューニングインターフェースを立ち上げる予定だ。これにより開発者は、現在進行中のファインチューニング作業に関する情報や、完成したモデルのスナップショット、カスタマイズ作業に関するその他の詳細情報に簡単にアクセスできるようになる。しかし、現時点では、この UI がいつ登場するかは不明だ。

OpenAI が、その特徴的な LLM の1つに、より企業向けのツールを組み込もうとする動きは理にかなっているが、同時に、Armilla AIApache Spark など、独自のサードパーティ製 LLM ファインチューニングソリューションを提供するスタートアップや既存企業のエコシステムが拡大していることと直接競合することになる。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する