「OpenAI DevDay」、「Microsoft Ignite 2023」を受け、最新のAI技術を駆使し、2日間でさらなるスキルアップを実現しました
AI関連サービスの開発を行う株式会社アンドエーアイ(旧社名:ドリグロ、本社:東京都渋谷区、代表取締役社長:西 真央、以下:当社)は、” AI企業として最新技術をいち早くキャッチアップし、プロダクト開発に活用することでさらなるスキルアップを実現する期間”として、11月20日(月)から11月21日(火)の2日間(実働時間合計16時間)にわたり「OpenAI DevDay」および「Microsoft Ignite 2023」で発表された最新のAI技術を活用したプロダクトの爆速開発に挑戦する「&AI DevDay」を実施しました。そこで開発された「サポートAIチャットボット作成ツール 」と「偉人占いチャットボット 」の2つのプロダクトに使用したGPT-4やEmbedding、Text-to-speech(TTS)などの最新技術および課題について、イベントに参加したエンジニアにインタビューした内容を共有します。
「&AI DevDay」開催概要
開催期間:2023年11月20日(月)~11月21日(火)
参加者:社内エンジニアメンバー全員
イベント概要:
社内のエンジニアメンバーは、通常業務を停止して3~4人ずつの2チームに分かれ、GPTの最新アップデート内容やMicrosoft Copilotなどの最新のAI技術を活用したプロダクトの爆速開発を行いました。各チームは事前に用意されたお題に沿って開発するプロダクトを決定し、2日間という限られた時間内で最大限の力を発揮してGPTストアなどに一般公開できるものを開発することを目標として取り組みました。またイベント終了時には、開発したプロダクトにどういった技術を使い、どういう点が難しく、それに対しどういう工夫をしたかを発表することで会社全体で知見を共有しました。
Aチーム成果物:サポートAIチャットボット作成ツール
概要
ChatGPTのAPIを活用して顧客からの問い合わせに自動で対応するチャットボットを、より簡単に作成および導入できるツールです。ユーザーは特定の業界やビジネスニーズに合わせた応答パターンを設定でき、AIがそれに基づいて自然な対話を行います。さらに、このシステムはChatGPTの高度な自然言語理解能力を利用するため、「会話が無機質なものになってしまう」「回答精度を高めるのに時間とコストがかかる」などの既存のチャットボットサービスの問題点をクリアしており、顧客の質問に対してより柔軟かつ人間に近い形で理解し、応答することができます。
使用技術
GPT-4 / Embedding (※1)
主要な課題とそれを克服した方法
ベクトル比較などのEmbeddingの難しい部分を、 LangChainというフレームワークを使用することでスムーズに実装できました。 LangChainは、GPTの他にもGoogleのPaLmなど他の言語モデルもカバーしており、チャットボットだけでなく検索エンジンや文書要約などの幅広いアプリケーションに適用可能な柔軟なフレームワークです。
今後の展望
1. 管理画面の開発
2日間という短い期間では管理画面にまでは手が回りませんでしたが、ユーザーフレンドリーで汎用性の高い管理画面の開発は必須です。管理画面の開発では、利用者が簡単に情報を登録・管理できるような直感的なUI/UXを提供することを目指します。これによりシステムの操作性とアクセシビリティが向上し、ユーザーが効率的に設定および自サイトへの導入を行えるようになります。
2. 対応できるサービスの幅を広げる
AIチャットボットをさまざまな業種や用途に対応できるようにすることで多様なビジネスニーズに応え、より幅広い顧客層にサービスを提供できるようになります。
(※1) OpenAIのEmbeddingは、テキストを数値のベクトルに変換する技術です。これにより、文章や単語の意味を計算可能な形式で表現し、機械学習モデルが理解できるようにします。この技術は、文章や単語の類似性を判断したり、関連する情報を検索したりするのに用いられます。
Bチーム成果物:偉人占いチャットボット
概要
ユーザーが悩みを入力すると、偉人がタロット占いを行い、悩みに対してアドバイスをしてくれるチャットボットです。このチャットボットは各偉人の個性を反映するように設計されており、よりリアルな対話体験を提供することができます。さらに、 OpenAI APIの最新アップデートに含まれるText-to-speech API(TTS)により、6種類の音声の中から選択した偉人に合った声が選択され、限りなく人間に近い流暢な音声でアドバイスが読み上げられます。
使用技術
GPT-4 / Text-to-speech(TTS)(※2)
主要な課題とそれを克服した方法
テキストが全て生成された後にTTSによる音声での読み上げが開始されるため、文章生成と音声のタイムラグが気になるという課題が生じましたが、今回の「&AI DevDay」では時間が足りず、まだ克服には至っていません。文章生成と音声出力をほぼ同時に行うために今後試してみたいのは、テキストを小さなセクションに分割する方法です。この方法では、各セクションのテキストが完成するたび、即座にTTSに送信します。これにより、テキストの全体が完成するのを待たずに部分的に生成されたテキストの音声読み上げを開始することが可能になるはずです。
今後の展望
1. 偉人の個性を強調する
今回採用したタロット占いでは、タロットの要素が強調され過ぎてしまい、結果として偉人それぞれが個性を出す範囲が狭くなってしまったように思いました。偉人の個性や特徴をより深く掘り下げ、ユーザーに対して独特でパーソナライズされた受け答えをさせるために、カウンセリングやおみくじなどの異なるアプローチも採用したいと考えています。カウンセリングでは、偉人の知見や経験に基づくアドバイスを提供し、おみくじでは偉人の言葉や思想を引用するなど、もっと面白いサービスに進化させていきたいと思っています。
2. 画像生成機能の追加
タロット占いやおみくじのテキストだけではなく、画像生成機能を活用してタロットカードの画像や偉人の似顔絵を生成し、ビジュアル面でのユーザー体験を豊かにします。視覚的要素が追加されることで、よりわくわくするサービスに近づくのではないかと考えています。
(※2) Text-to-speech(TTS)は、テキストを人間の声に近い音声に変換するChatGPTのAPIです。このシステムは、文章を読み上げる際に自然な発音やアクセント、イントネーションを模倣し、音声を生成します。近年の進歩によりTTSの声はより自然で人間らしいものになっており、多言語に対応することも可能です。
代表取締役社長 西 真央のコメント
株式会社アンドエーアイ代表取締役の西真央と申します。弊社は「老若男女誰でも簡単に使えるAIサービス」を目指して、生成AIによるプロダクト開発を行っております。
今回の「&AI DevDay」は、2023年11月7日に開催された「OpenAI DevDay」、および11月15日に開催された「Microsoft Ignite 2023」を受け、アンドエーアイがAI企業としていち早く最新技術をキャッチアップするため、社内のエンジニアメンバー全員の通常業務を2日間停止させて実施しました。技術が驚くべき速さで進化し続ける中、この変化に迅速に対応し、常に最先端を追求するためには、私たちは時間とリソースを惜しまずに投資する必要があります。今回のDevDayは、そうした学習と成長の機会を提供し、社内メンバー全員のスキルと知識を高めるためのものです。当社は、これからもAI業界の最前線で活躍し続けることを目指して取り組みを続けていく所存です。皆様の変わらぬご期待と応援を賜りますよう、心よりお願い申し上げます。
株式会社アンドエーアイ (旧ドリグロ)
株式会社アンドエーアイは、「日本のすべての人に、AIのある生活を」というビジョンを掲げ、東京・大阪を中心に生成AIを使用したサービスの開発、及びモバイルアプリの開発を行っています。「老若男女誰でも簡単に使えるAIサービス」を目指してAI活用やChatGPTの組み込み、AIチャットボットの開発も行っており、世界をより良く変えるような歴史に残るプロダクトをつくるために日々開発を続けています。また、アプリ開発ではGoogleが提供するiOS、Android、Webに対応したアプリ開発のフレームワークであるFlutterを使用しており、企画からデザイン、開発、リリースまで、お客様に寄り添いながらアプリ開発を進めていきます。
会社情報
社名:株式会社アンドエーアイ(旧ドリグロ)
代表取締役会長:松永 佳悟
代表取締役社長:西 真央
CTO:津田 大和
東京オフィス:東京都渋谷区渋谷2-24-12 渋谷スクランブルスクエア 39F
大阪オフィス:大阪府大阪市北区曽根崎1-2-8 マルビル7F
設立年:2018年4月18日
事業内容: AI事業 / スマートフォンアプリ制作
会社URL: https://andai.net/
報道関係者からのお問い合わせ先
株式会社アンドエーアイ
広報担当者:小西
TEL:06-6585-0004
E-mail:[email protected]