ChatGPT登場で勢い増す「会話型」ジェネレーティブAIーーカオスマップで見る「10のカテゴリ」

SHARE:
Photo by Kindel Media

ピックアップ:How to navigate today’s conversational AI and text generative landscape

OpenAIの対話型AI「ChatGPT」がAPIを公開し、そのバージョンを3.5から4に引き上げたことで、世の中の景色がガラリと変わってしまったと感じている人も多いのではないでしょうか。この領域の第一人者、松尾豊教授のインタビューにも結構な反響が集まりました。

軽くおさらいしておくと、ChatGPTはOpenAIのGPT言語モデルをベースに構築されており、会話への参加、質問への回答、文章生成、コードのデバッグ、感情分析の実施、言語の翻訳など、さまざまな機能を提供してくれます。最新バージョンの4では、テキストのみではなくマルチモーダルに対応したことから、冷蔵庫の中身を画像で認識して今日のレシピを教えてくれる、そういうことが可能になっています。

ソーシャル上で流れてくる情報の波にわくわくしつつ、その一方で少し落ち着いて頭の整理をしたい人も多いのではないでしょうか?そんな方に(筆者もです)おすすめのマップがありました。Daybrake Insightsというリサーチ会社の共同創業者、Dong Liu氏とNader Ghaffari氏がVentureBeatに寄稿した記事中にも使われているものなんですが、ChatGPTが提供する様々な機能を分析し、これらの機能の1つまたは複数を満たすテックカンパニーをまとめたものになっています。

Image Credit : Daybreakes Insights:リンク先にPDFもあり

このカオスマップはテキスト入力(自然言語処理/NLP)を基盤としたジェネレーティブ(生成)AIを10のカテゴリに整理しています。一番下には言語モデルであるOpenAIのGPTやGoogleのLaMDA、Meta AIが開発しているOPT-IML、BigScienceがBLOOMなどがあります。例えば今回、影が薄かったMeta AIですが、昨年9月にはテキストから動画を生成するAI「Make-a-Video」を公表して世界を驚かせています。

これらの言語モデルが一番下の基盤としてあり、その上にテキスト要約や感情分析、テキスト翻訳というカテゴリーが並んでいます。例えば文章を抜粋して要約するQuillBotやUpword、spaCy、感情分析してくれるMonkeyLearnやRepustateといった具合です。そしてここ数カ月、世界を驚愕の渦に巻き込んだ「会話型AI」も中央上段にまとめられており、ChatGPTをはじめGoogleのBardやOpenAIを出たAnthropicが開発するClaudeなどがここに並んでいます。音声チャットであればGoogle AssistantやSiri、Alexaなどがありますが、ここは大きくバージョンを変えてくるはずです。以下に10のカテゴリをサマリーにしておきます。

10種類のカテゴリー

  • テキスト要約
  • 感情分析
  • テキスト翻訳
  • バーチャルアシスタント:従来のチャットボット
  • チャットボット構築
  • チャットボットフレームワーク
  • ライター
  • コーディング
  • 検索
  • 基盤となる言語モデル

記事ではこれらのランドスケープには700社以上の企業が存在しており、その一部のみを掲載しているそうです。チャットボットがごまんと溢れていたことを考えると、APIを叩いてちょっとしたサービスを作る程度ではもうすでに差別化は難しそうです。

BRIDGE Members

BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。
  • 会員限定記事・毎月3本
  • コミュニティDiscord招待
無料メンバー登録