Microsoft、Pythonライブラリ「AutoGen」でLLMアプリケーションフレームワーク競争に加わる

SHARE:
Image credit: Microsoft

Microsoft は、オープンソースの Python ライブラリ「AutoGen」で大規模言語モデル(LLM)アプリケーションフレームワークの競争に加わった。

Microsoft の説明によると、AutoGen は LLM ワークフローのオーケストレーション、最適化、自動化を簡素化するフレームワークである。AutoGen の基本コンセプトは、「GPT-4」などの LLM を搭載したプログラミングモジュールであるエージェントの作成だ。これらのエージェントは、自然言語メッセージを通じて相互に作用し、さまざまなタスクを達成する。

エージェントは、プロンプトエンジニアリング技術や外部ツールを使用してカスタマイズおよび拡張することができ、情報を取得したりコードを実行したりすることができる。AutoGen を使用すると、開発者は、異なるタスクに特化し、互いに協力するエージェントのエコシステムを作成できる。

エージェントエコシステムの単純化されたビューは、各エージェントを固有のシステム命令を持つ個々の ChatGPT セッションとして見ることだ。例えば、あるエージェントは、ユーザのリクエストに基づいて Python コードを生成するプログラミングアシスタントとして動作するように指示することができる。

別のエージェントは、Python コードのスニペットを受け取り、トラブルシューティングを行うコードレビュアーになることが可能だ。最初のエージェントからの応答は、2番目のエージェントへの入力として渡すことができる。これらのエージェントの中には、「Code Interpreter」や「Wolfram Alpha」のような ChatGPT プラグインに相当する外部ツールにアクセスできるものもある。

Image credit: Microsoft

AutoGen は、このようなエージェントを作成し、それらが自動的に相互作用できるようにするために必要なツールを提供する。 これは、許可されたライセンスでオープンソースとして使用することが可能だ。

マルチエージェントアプリケーションは、完全に自律的であることもヒューマンプロキシエージェントによって管理されることもある。いわば、人間のユーザは、複数のAIからなるチームを監督するチームリーダーになるのだ。

人間エージェントは、エージェントフレームワークが微妙な決定をしなければならず、ユーザの確認を必要とするようなアプリケーション、例えば購入や電子メールの送信などに有用である。

また、エージェントが間違った方向に進み始めたときに、ユーザが軌道修正する手助けをすることもできる。例えば、ユーザはアプリケーションの最初のアイデアから始め、エージェントの助けを借りてコードを書き始めると、徐々にそれを洗練させ、機能を追加したり修正したりすることができる。

AutoGen のモジュラーアーキテクチャにより、開発者は汎用の再利用可能なコンポーネントを作成し、それらを組み合わせてカスタムアプリケーションを迅速に構築することができる。

複数のAutoGenエージェントは、複雑なタスクを達成するために協力することが可能だ。例えば、人間のエージェントが特定のタスクのコード記述の支援を要請することがある。

コーディングアシスタントエージェントはコードを生成して返すことができ、AI ユーザエージェントはコード実行モジュールを使ってそれを検証することができる。2人の AI エージェントが一緒になってコードをトラブルシューティングし、最終的な実行可能バージョンを作成する。

この協調的アプローチは、大幅な効率化につながる。Microsoft によるとオートジェントはコーディングを最大4倍スピードアップできるという。

AutoGen は、LLM エージェントの階層的配置など、より複雑なシナリオやアーキテクチャもサポートしている。例えば、グループチャットマネージャーエージェントは、複数の人間ユーザと LLM エージェント間の会話を司会し、一連のルールに従ってエージェント間のメッセージを伝達することができる。

激しい競争

LLM アプリケーションフレームワークの分野は急速に発展しており、Microsoft AutoGen は他の多くの競合と競い合っている。LangChain は、チャットボットからテキスト要約やエージェントまで、様々なタイプの LLM アプリケーションを作成するためのフレームワークだ。LlamaIndex は、LLM を文書やデータベースなどの外部データソースに接続するための豊富なツールを提供する。

AutoGPTMetaGPTBabyAGI などのライブラリは、特にLLMエージェントとマルチエージェントアプリケーションに焦点を当てている。ChatDev は、LLM エージェントを使ってソフトウェア開発チーム全体をエミュレートする。また、Hugging Face のライブラリ「Transformers Agents」は、開発者が LLM を外部ツールに接続する会話型アプリケーションを作成することを可能だ。

LLM エージェントは研究開発のホットな分野であり、製品開発からエグゼクティブ機能、ショッピング、市場調査まで、さまざまなタスクのプロトタイプがすでに作成されている。また、LLM エージェントを用いて、集団の行動をシミュレートしたり、ゲームにおけるリアルな非プレイアブルキャラクターを作成したりすることも研究されている。しかし、LLM エージェントの幻覚や予測不可能な行動などの課題があるため、この研究の多くはまだ概念実証にとどまっており、製品化には至っていない。

こうした課題にもかかわらず、LLM アプリケーションの未来は明るく、エージェントが重要な役割を果たすことになりそうだ。テック大手はすでに、AI Copilot が将来のアプリケーションやオペレーティングシステムの大部分を占めることに大きく賭けている。そして、LLM エージェントフレームワークは、企業が独自にカスタマイズした Copilot を作成することを可能にするだろう。Microsoft の AutoGen によるこの分野への参入は、LLM エージェントをめぐる競争の激化とその将来の可能性を示すものだ。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する