シリコンバレー発の国産「Glasp」100万DL、ヒットの鍵は“タイミング”と“スピード”【CACテックインサイト】

SHARE:

本稿はベンチャーキャピタル、サイバーエージェント・キャピタルが運営するサイトに掲載された記事からの転載。毎月第2水曜日に開催される Monthly Pitch へのピッチ登壇をご希望の起業家の方、オーディエンス参加をご希望の起業家の方の応募はこちらから

CACテックインサイトはサイバーエージェント・キャピタルのテクニカル・マネージャー、速水陸生がスタートアップのテックインサイトをお聞きするシリーズです。ChatGPTをはじめ、テクノロジーが大きく動く今、各社の技術的な取り組みをお伝えします。

Glaspはシリコンバレーを拠点に、AIを用いて自分が興味のある情報のみ検索できたり、自身の知識をデジタルレガシーとして発信できたりする、コンテンツシェアSNSサービス「Glasp」を開発しています。昨年12月には、ChatGPTが公開されてまもなく「YouTube Summary with ChatGPT」という、動画の内容を自動的に要約してくれるChromeエクステンションを公開し反響を集めました。今目の前にある技術で何ができるか、いち早くそれを具現化した形です。

サイバーエージェント・キャピタルのインサイトでは、これらのサービスを主導され、日々、ジェネレーティブAIを使ったサービスの開発に注力されているGlaspの共同創業者で代表取締役の中屋敷量貴さんにお話を伺いました。

半年早かったChatGPTのトレンド

 

今回お伺いしたいのが、大きく分けて4つです。まずはGlaspがどのようなサービスか。次に今回、ChatGPTの機能を導入されるにあたってChatGPTの登場をどのようにに受け止められたか、導入に至るまでの経緯をお聞きしたいです。

3つ目がプロダクトに、ChatGPTの仕組みを導入されたときの工夫や大変だった点、最後に、プロダクトに導入してユーザーさんにも使ってもらっている中で、ジェネレーティブの文脈、LLMの文脈でどのような変化があるのか、将来の可能性と展望のお話を伺えたらなと思っています。

では、最初にサービスについてなんですが、実際、ユーザーさんはどのような活用され方が多いですか。

中屋敷:活用のされ方はいくつかありまして、ひとつはコンテンツライター、ニュースレター、ブログを書いてる人が情報を貯めておいて、何かコンテンツを作るときに活用するというシングルプレイヤーユーティリティ的なところがあります。

もう一つがソーシャル性があって、人が何を読んで何を学んでるかが見えるプラットフォームなので、コンテンツディスカバリー的な目的で使ってる方がいます。ニュースレターの場合は作って、オーディエンスにシェアするので、どこで自分のアイディアを得たのかを見えるようにしてる人もいます。最近出会った面白いユーザーグループでいうと、VCのインベスターの方がよく使ってくれています。

VCで働くインベスターの人も日々トレンドを追って、例えばAIは何が起きてるのかみたいな記事を読んだり動画を見たりしてるので、そういった方々にも刺さっていて、そういった方がチームで情報を共有したりとか、個人的に読んでるログとして残しておくみたいな感じで使ってくれてる方もいます。

情報収集を中心に仕事の中で取り組まれてる方が多いということですね。

中屋敷:情報の収集と共有と発見ですね。

発見からアウトプットしていくという文脈があるなと思うんですけど、インベスターの方や記者以外の利用ユーザーにはどのようなセグメントがありますか。

中屋敷:学生さんの方が使っていたり、リサーチャーでマーケットリサーチしたいコンサルタントの方ですね。その他に、面白いなと思ったところは、聖書のバイブルをハイライトして、シェアしている人がいますね。あとはジョブポスティングを貯めている人や、Amazonなどのeコマース系の商品も、レビュー含めて詳細情報を貯めておいたりする人もいます。

グローバル展開されてるからこそいろんな職種の方が使っているんですね。

中屋敷:リサーチャーから弁護士の方だったり、多岐にわたって使われてます。

ところで中屋敷さんはChatGPTが出た時、いち早く機能の導入をされましたが、どのような変化を感じて導入に至ったのですか?

中屋敷:登場したのはTwitterで知りました。前兆としては数年前からGPT-3が伸びて、Stability AIやライティングアシスタントのLexなどの登場で盛り上がりを感じていたんです。その後、『自分たちに何ができるかな』と考えていたところ、ChatGPTが発表されました。昨年の11月頃の話です。

盛り上がりはリアルで感じられたんですか。それともオンライン上ですか?

中屋敷:両方ですね。もちろんTwitterで毎日新しいプロジェクトだったり、GPT-3などの技術が日々バズっていましたし、トップティアのVCなどがマーケットマップを作成してTwitterでシェアしているのを見たりしていました。実際に米国現地のファウンダー間でも、ジェネレーティブAIすごいよねという話は来てたので両方でこれは来るなと感じてました。それはChatGPTが発表されるもう少し前、去年の9月ぐらいです。

現地のコミュニケーションでいうと、日本で感じたものに比較して半年ぐらい早いなという印象ですね。改めて速度の違いがありますね。いかがですか、やはり日本は遅い印象がありますか。

中屋敷:ChatGPTがバズった後に関して言うと、60日で1億人のユーザーに到達ですからすごく浸透は速かったように思います。ただ、その前のボルテージの部分は、あまり日本の方から聞きませんでした。単純にコンタクトがなかったというのはあると思いますが。それと確かにChatGPT登場以降は一瞬で世界中に広まりましたけど、もう少しマイクロなトレンドに関してはこちらだけで盛り上がっていた印象があります。

技術キャッチアップは支援プログラムで

Glaspを支援するエンジェルとして参加するOpenAIのシェイン・グウさんとのひとコマ

少し話題を変えて組み込みについて。実際にどのように組み込んだんですか。導入に踏み切った背景であったりとか、その後どのようにに実装を進めていきました?

中屋敷:実はChatGPT以前にも、いくつかGPT-3などを使ってサービスを出していました。例えばDALL-Eを使ってプロンプトを推測するゲームとか、小さなプロジェクトを立ち上げていたので、何かをタイミング良く出したら盛り上がるだろう、という感覚はありました。
だからChatGPT以降に関してもその流れで『出てきていきなり何か作ろう』じゃなくて、元々いろいろ作っておいて、タイミングがきたからこれを使って面白くできないかな?というマインドで開発しています。

去年の11月ぐらいに「Inception Studio」というAIに特化したアクセラレーションプログラムの1期目に参加したんですね。まだパブリックな情報はシェアされてないんですけど、本当にすごい方々ばかりで、例えばTransformerの開発に携わった方など、ジェネレーティブAIのコアな人たちと一緒に3日4日の泊まり込みで合宿してアイディアを交換したりとか、実際にみんなで作ったりしたんです。それ以前は自分で作ってましたが、それをきっかけにどのような技術がどのように使えるかわかるようになりました。

今でこそみんなが使ってる技術なんですけど、去年の10月とか11月ぐらいのタイミングでもうテキストエンべディングという技術が面白いから使えると教えてもらったり、あとはファインチューニングもこういう感じでやると良いよというノウハウも教えてもらいました。

こういった経緯があったので、Glaspを開発する際もPineconeというベクトルデータベースの技術を使ってハイライトした文字をベクトルに書き直し、それをベクトルデータベース使って「What’s the future of AI?」と聞いたら、自分の過去のハイライトやノートとかコメントからデータを引っ張ってきて、まるで自分が答えてるかのように回答してくれるようなところも、去年の早い段階で開発していました。多分、自分1人だけだったらできなかったことだと思います。

開発で難しいのはどうやって作るんだろうというのがひとつと、どうやったら一番いい感じにパフォーマンスが出せるのだろうという知見なのかなと思っていて、ここにいると、いろんな人がいろんなもの作ってたりするので聞いてみたら教えてくれたりするんですよね。こういうふうにやってるんだとオープンソースにしてる人も多いので、使ってみようというのはあったのかなと思います。

Inception Studioというプログラムについてもう少し詳しく教えてもらっていいですか。

中屋敷:Discordベースで動いていて、100人ぐらいの人を呼んで、そこに参加したFounderたちが、デモできる場を設けてもらったりとか、それこそAndreessen HorowitzとかSequoiaといったトップティアのVCを呼んで、クローズドなプロジェクトをやったりしています。1期目として人の繋がりで参加できました。

基本そちらのコミュニティってDiscordですよね。

中屋敷:確かに多いですよね。

次にお話伺いたいのが、リリースしたときの反響です。スピード感持って出せてたと思うんですが、そのあたりの反響はどうでしたか。

中屋敷:出す前はジェネレーティブAIの界隈で何者でもありませんでしたが、出した後はYouTube Summary with ChatGPTが、今日時点(※)で54万インストールぐらいされています。イベント行ったりハッカソン行ったりTwitterにいると、お前がこれを作ったのかみたいに声かけられたりとか、イベント行って座ってたら、声かけられてGlaspのファウンダーだよね、使ってるよみたいに声かけられるようになって、そういった意味で反響があったのかなとは思います。
(※:5月の取材時点。7月時点の現在は累計100万インストールに加速)

ChatGPTのムーブメントは大きかった?

中屋敷:AIブームに乗ったところはあります。ちょっと乱暴ですが、その当時はChatGPTで何かを作れば何でもTwitterでバズるような状態でした。初期の頃はそのアドバンテージを取っていった人は多かったのかなと思います。

ブームが落ち着いた後

ここまでは出してすぐのお話でしたが、しばらく経ってジェネレーティブAIやプロダクトの雰囲気はどのように変化していますか。

中屋敷:継続して毎日インストールがあったり利用者がやってきて、というのは継続していて波及効果を感じています。TwitterとかYouTubeでは未だに『ChatGPT使った良いツール10選』みたいな感じでシェアされたりしていますね。

ただ、全体的なところで言うとやはり単なるアプリを出しても陳腐化してきた感はあります。最近だと技術に踏み込んだものが出たときに、おっとなる感じです。例えばLangChainだったり、BabyAGIとかAutoGPTとか、技術ドリブンなところに移行している印象があります。

中屋敷さんも技術まわりに投資を進めていこうと考えていますか?

中屋敷:Language Modelが作れるほどの技術力や体力がないので、あくまでアプリケーションレイヤーにフォーカスしていきます。
最近ハッチングアイディアという機能をリリースしました。

これはGlaspで自分が学んでためたもの、例えば何かの記事のページをハイライトしました、ノートを残しましたというのがあったとすると、それを基にランダムに関連するデータを2個ぐらい引っ張ってきて、新しいアイディアを作らせる、というものです。我々のプラットフォームでキュレーターとして情報を集めてくる人はすごい多いんですけど、集めるだけで終わったりする方も多いので、そういう人がクリエイターになれたらもっと面白い世界がくるんじゃないかなと思っているんです。

情報を集めたらGlaspがそのアイディアを繋げて、GPTが勝手にコネクションを見つけ出して、アイディアを付加させてくれる。こういったアプリケーション的なところは面白いなと思ってるので、今後もやっていきたいです。

では最後に、会社の展望について教えてください。

中屋敷:自分たちのチームでも最近話してるんですけど、Language Modelの強みが何かと考えたら、クリエイトするところなんです。ジェネレートする部分と、サマリーするところがあると強く思っていて、イメージや動画はそれで面白い世界観があると思いますが、テキストベースではジェネレートするところとサマライズするところかなと思っています。

ChatGPTに聞けば記事もメールも書き直してもくれるし、何でもジェネレートしてくれる世界が生まれました。

一方で、我々の時間には制限があります。そこに何ができるかと言ったら、サマライズして消費する量を増やすことかなと。

あとはパーソナライゼーションとかインディビジュアライゼーションと言われる個別化、差別化が、今後の流れかなと思っているので、いかにしてコンテクストをLanguage Modelに渡すかが大事になってくるのかなと思っています。

その文脈でベクトルのデータスペースがあればLanguage Modelが保持できるデータをコンパクトにできるので、例えばその人に関する情報だったりその人の過去の動向みたいのを引っ張ってきて、その人に向けた提案だったり、クリエーションだったり、あとサマライゼーションが提供できるのかなと思います。

Glaspはその人が関心のある部分を集めてきてるので、そういうコンテクストをしっかり受け渡してあげたら、より良い提案や予測、何でもできるのかなと思ってます。

具体的にパーソナライゼーションする上での課題感もありつつも、ベクターのデータベースを使うといった可能性や、しっかりしたレベルのプロダクトは出てきていないと思うので、僕も結構期待しています

中屋敷:こっちのイベントでもよく話題になってるんですけど、動きが早いジェネレーティブAIの中で、スタートアップは何が差別化になるんですかと。MOATは何なんだろうという話はよく出てきていて、自分もずっと考えてます。

いろんな重鎮の方から一般的な考え方の人まで話をするのですが、Language Model自体が差別化になることは、アプリケーションレベルではもうほぼないのかなと思っています。プロンプトの領域でまだベンチマークがないので、欲しいものに対してどうしたらいいのかわかんないというところに関してはまだ可能性はあるのかなと思っていて、一般的なLanguageモデルを使ってやるだけでは差別化は難しいのかなと思っています。

早く動くのは間違いなく大事だし、何か完璧なものじゃなくて、とりあえず出してみてフィードバック見てみるとかはやってみてもいいのかなと。自分たちもそうしてます。

日本の方はかなり面白いアイデアに取り組んでいる方が多いなと個人的に思っています。米国現地の方はパワープレーで強い印象ありますが、日本は技術的なところとか、広めるといった点でとても上手い方がいる印象です。

ありがとうございました

<関連記事>

BRIDGE Members

BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。
  • 会員限定記事・毎月3本
  • コミュニティDiscord招待
無料メンバー登録