ChatGPTのAIアバターと英会話ができるfondi、そのスピード開発のウラ側ーーカムスタ!チームワークのお話

SHARE:

本稿はベンチャーキャピタル、サイバーエージェント・キャピタルが運営するサイトに掲載された記事からの転載。掲載されているfondiの採用情報はこちらから

カムスタ!「チームワークのお話」は成長しているスタートアップのチームについて、その成り立ちや工夫、日常の何気ない風景をお伝えするインタビューシリーズです。今回は英会話特化のメタバース「fondi」を手がける野原樹斗さんと磯上樹さんにご登場いただきます。

fondiは、英会話学習に特化したメタバースです。世界中の英語学習者とアバターを使って音声でコミュニケーションを楽しむことができ、iOSとAndroidアプリで提供されています。

fondiにはパークやバー、ラウンジなどの複数のエリアがあり、たとえばパークでは近くにいる人同士がフランクに立ち話をしたり、バーではバーテンダーが提供してくれるトークテーマに沿って他のユーザーと1対1で落ち着いて会話ができたりするなど、会話しやすくなる仕組みが用意されています。

fondiは野原さん(代表取締役CEO)と磯上さん(共同創業者兼CTO)が2017年に創業しました。CEOの野原さんは1996年生まれで、高校卒業後にイギリスのウォーリック大学に進学しました。fondi立ち上げ以前には自身の留学経験を元に、留学の経験者と希望者をつなぐマッチングサービスや、留学希望者のための意思決定サポートツールなどのサービスをプロデュースされています。

一方のCTOを務める磯上樹さんは1997年生まれ。セブ島でのIT留学からプログラミングを始め、fondiでは、Unityを用いたフロントエンドアプリケーションとPHPバックエンドから成るシステムを設計・開発されています。

アバターで英会話の障壁を下げるfondi

fondiについてまず教えていただけますか

野原:fondiは3Dのバーチャル空間上で、世界中の英語学習者同士が国境を超えて参加し、リアルタイムで英会話を楽しむことができるアプリです。

私自身、元々イギリスの大学に留学していた経験があったため、最初は留学のサポート事業を始めたんです。当時は事業立ち上げから一緒に取り組んでいたメンバーと共に、留学を実際に日本から海外に向けて行うためのサポートを行っていました。

しかし、お金や親の反対など、留学を諦めてしまう人が多かったため、なかなか事業として難しい部分がありました。そこで、留学をバーチャルで体験できるアプリを開発することになったんです。

2020年5月に正式にサービスを開始し、既に2年以上が経ちました。最初の1年間は、どのようなユーザーに使ってもらえるのかわからないまま基盤を作っていた感じですね。

国別のユーザー数のバランスは、日本人ユーザーが約6%程度で、インドネシアとベトナムで40%弱です。それ以外は東南アジアやアフリカ圏のユーザーが多数利用しており、彼らが英語学習者であるため「カタコト」の英語で会話しているのが特徴です。会話のハードルを下げることで、自然な会話が生まれるようにしています。

やはり英語が人生を変える国々の人々がニーズの背景にあると考えています。しかし、そういった人たちにとって、毎月40ドルから100ドルの英語レッスンにお金を払うのは難しい場合があります。そのような人たちが支持してくれている印象です。

フィードバックに関して多いのは、英語に真面目に取り組んでいるユーザーがたくさんいるということと、やはり顔を見せないので恥ずかしさが低減されるので、英語を話すことに対する障壁が低くなるという2つの点です。

アバター英会話で心理的な障壁を下げるというアイデアのfondi

これは実際の人たちとお話しているんですよね

野原:実際の人たちです。リアルタイムで海外や世界中から集まる英語学習者がアクセスして、勉強しています。先生のような存在がいないので、ユーザー同士がたどたどしい英語を実践しながら繰り返しトライアンドエラーをして、自信を積み重ねていってる感じですね。

友人とのつながりや海外の人との交流などを通じて、徐々にコミュニケーションの内容が変化していくので、そういった体験に到達できるかどうか、コミュニティに参加できるかどうかを重視しています。
現在、新規ユーザーを含めた会話時間の平均は約1時間ほどです。そしてさらに間口を広げるためにGPTやAIとの会話など、新しい入り口を作ってハードルを下げることもチャレンジしています。

より会話したくなる仕掛けは

野原:例えばバーで会話ができるマッチングエリアがあります。このエリアは、その場にいる人とすぐに立ち話ができるような体験ができたりします。

会話が楽しくなるような仕掛けを作っていて、ダーツのような簡単なカジュアルゲームや、動画を一緒に視聴したり、コミュニケーションに特化した会話ゲームなども用意していますし、バーテンダーが会話のトピックを提供してくれることもあります。こういった仕掛けをどんどん増やしていってますね。

面白いのは8人のユーザーが集まって、同時にモーションをして、一緒にポージングを取って楽しむようなことをしている人たちがいたんです。これは想定外の出来事で、運営側も新鮮さを感じました。

ChatGPTをスムーズに採用できたワケ

アバターのアイデアで英会話のハードル、特に「話しかける気まずさ」をクリアしているfondiですが、この4月に新たな機能を追加しました。それがChatGPTを組み込んだ「AIとの会話練習エリア」です。

AIアバターである「キャサリン」が案内人として登場し、音声入力ボタンから自分の発話内容を返すと、AIアバターが音声で返答してくれます。また、ボタン一つで言い換えや会話トピックの変更をAIアバターに要求することもでるようになっています。AIとの会話で自信がついたユーザーは、その場で世界中の英語学習者とマッチングできるようにもなる、というわけです。

これらの機能は、OpenAIが公開したChatGPT API(gpt-3.5-turbo)及びWhisper API(音声認識API)を活用して実現されました。3月にAPIが公開されてから約1カ月というスピード開発を実現したチーム連携についてお聞きしました。

開発の経緯は

磯上:去年の7月か6月頃かな、GPT-3を使用して、会話のロールプレイングや、自分が言うべきフレーズの提案など、話す内容に対してGPT-3がフィードバックするテストをやったんです。UI/UXデザイナーを担当していただいている柳田裕向さんが体験設計し、エンジニアの中澤慧さんが技術的実験をしてくれました。その当時のGPT-3は精度やレイテンシーに問題があって実用にはいたりませんでした。

しかしChatGPTのサービスが登場して、文字ベースでのやり取りだったんですが、これは使える、と社内でも話題になったんです。

APIが出ると、かなり変わるかもしれないというのが最初でした。ChatGPT 3.5 Turboであれば、かなりやりたかったことができるようになるかもしれないという期待感があったんです。

それで社内用デモをもう1人のエンジニアメンバーの中澤さんが作ってくれました。彼はずっとゲーム会社でR&D部門にいて、こういう技術やコンテンツを昔から追っていたので、APIが正式公開になったタイミングで、社内向けにサクッと作ってくれて。

どういう体制で開発しているのですか?

磯上:まず、データアナリストと共に、プランナーと呼んでいる設計者が、競合調査、定性・定例を背景に施策立案をします。それをデザイナーとプランナーが体験に落とし込み、エンジニアが実装を進めていくという一般的な体制です。現状はフルタイムが5名で、パートタイム/副業メンバーが十数人という規模なので、フルタイムメンバーがそのコミュニケーションの中心になって、開発の出力を保っっている状態です。

そこから一気にリリースまでいった

磯上:最初のChatGPTが公開されてからおそらく1週間ぐらいですね。中澤さん主導で、それを社内で試してみたんです。それまで問題だった音声認識の精度や速度が非常に高く、AIと会話する体験が実用レベルに達したと判断しました。その後、デザイナーが参加して実際にアプリに実装し、という流れです。

開発チームはみなさんリモート?

磯上:基本的にはバラバラな働き方をしています。私たちは六本木のオフィスに出社することが多くて、リモートで普段仕事をしているメンバーが2週間に1回ぐらい東京で集まるという働き方をしています。オンラインでも状況は確認できますしね。

徹底的なドキュメンテーション文化

離れて働くことの工夫は

野原:普段は基本的にSlackのハドルなどで、メンバーがいつでもコミュニケーションが取れるようにしています。ただ、やはりテキストベースのコミュニケーションが中心なので、当社の工夫として、相当なドキュメンテーションを用意しています。Notionなんですが、仕様や背景情報など、ChatGPTのときも開発に向けてどういうスタンスで進めるかなど、思考をフローとして記載し、プロセスの多くをドキュメントにまとめています。

どこで働いていても、ドキュメントを確認することで情報が整理されているので、各個人がどのようにAIに向き合うか、現在の事業の優先度などが把握できますし、3カ月に1回程度は事業の成長に向けてどのような状態にするかもまとめています。

副業メンバーなどの半分ほどはまだ会ったことがない状態です。エンジニアメンバーの半分以上は、35歳以上で、30代のゲーム業界を中心に活躍している方が多いです。スキルベースで自立して動く方が多いですね。

具体的なドキュメンテーションはどのようなものがありますか

野原:3カ月、6カ月、1年以上という期間単位ごとに、fondi社全体の中長期の指針を示すドキュメントや、プロダクト開発やマーケティングなど、組織内のチームそれぞれの具体的な短中期指針、アクションを明示するドキュメント。それに各チームの施策の検討背景をまとめた思考ドキュメントや仕様書など、色々な粒度で、fondiの動きに読めばキャッチアップいただけるようなドキュメントを充実させています。

ChatGPTなどの登場でひとりの人間ができることの範囲が広がりましたよね

磯上:私たちは今もそうですが、技術的な面白さを取り入れるポジティブなスタンスを持つことが重要だと思ってます。根本的には、ユーザーのためにプロダクトを改善できるかどうかということがすべてなんですが、最近の生成AI系のツールも含めて使えるものは使ってユーザーの価値を最大化する方法を考えることじゃないでしょうか。

ありがとうございました。

BRIDGE Members

BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。
  • 会員限定記事・毎月3本
  • コミュニティDiscord招待
無料メンバー登録