NLP技術を用いてホワイトカラーのDX推進を目指す
東京大学松尾研発・AIスタートアップ、株式会社ELYZA(イライザ、本社:東京都文京区、代表取締役 曽根岡 侑也)は、日本語における生成型要約モデルの開発に成功しました。また本日より、当モデルを用いた要約AI “ELYZA DIGEST”(イライザ ダイジェスト)をデモサイトとして一般公開いたします。
▮当ニュースのサマリー
東大松尾研発のスタートアップELYZAが文章要約AI “ELYZA DIGEST” を公開した。
日本語での大規模言語モデルを活用した結果、高精度な生成型の要約モデルを実装した。
社内検証では、人間に匹敵する正確な内容の要約文を出力できるという結果に。
社会実装の第一歩として、カスタマーセンターの対話要約の作成業務を対象に、東証一部上場企業(SOMPOホールディングス株式会社)のグループ会社(損害保険ジャパン株式会社)で採用された。(ニュースリンク:https://prtimes.jp/main/html/rd/p/000000009.000047565.html)
※当リリース内にAIが実際に要約した結果のサンプルを掲載しております。
▮概要
要約AI “ELYZA DIGEST” とは何か。
“ELYZA DIGEST” は入力したテキストデータを3行に要約するAIです。「生成型」の要約モデルであり、読み込んだテキストを元にAIが一から要約文を生成します。書籍・小説・ニュース記事のような誤字脱字の少ない綺麗な文章だけでなく、議事録・対話テキストのような乱雑な文章・文字列であっても対応可能です。テキストの直接入力以外にもURLを張り付けることで該当ページ内の全テキストから要約文を作成できます。
当AIモデルは、NLP(自然言語処理)の最先端技術を活用し開発され、2021年7月1日より東証一部上場企業であるSOMPOホールディングス株式会社と開始した実証実験でも利用されています。
下記URLより、登録不要でご利用いただけます。
https://www.digest.elyza.ai/
▮どのような「未踏」への挑戦なのか
医療・弁護士・メディア・コールセンターなど高度に言葉を扱うホワイトカラーとAIのさらなる共存
この度公開した “ELYZA DIGEST” で用いられている要約AIを改善していくことで、言葉を扱うホワイトカラーの方々の生産性を向上させていきたいと考えております。
具体的には、医療におけるカルテ入力、弁護士業務における契約書類や判例の読解、コールセンターにおけるオペレーターの対話メモ作成、メディアにおける記事の原稿作成、あらゆるホワイトカラー業務で発生する議事録づくりなど多数のユースケースでの活用を想定しております。
実用化まで一歩届いていなかった言葉を扱うAI、近年のブレイクスルーにより実用化へ
音声認識や画像認識分野における技術の発展により、対話の音声データや紙のスキャン画像を「テキストデータに変換できる」段階までAI活用が進んでいます。一方、そのテキストデータを「言葉として理解し活用するための技術」(NLP)が「人間に遠く及ばない」精度にとどまっていたため、ホワイトカラー業務を代替/サポートする上では不十分なことが多く実用化が一部の領域に限定されていました。実用化が進んでいなかった事例として、コールセンター業務におけるAI活用があります。顧客とコールセンターのオペレーター間の対話において、音声認識AIによって文字起こしを行うことで、認識ミスはあるものの、対話音声をテキストデータに変換することができています。一方で、それらのテキストデータに対する要約や集計などの作業は、AIの精度が足りず、依然として人が行わなければならない作業となっています。
そのような中、2018年秋にNLP分野でブレイクスルーが起き、Googleより大規模言語モデル「BERT」が発表され、2019年には「人間を超える」精度が達成されました。そのため、英語圏ではNLPの最先端技術を実用化したサービスや事例が誕生しています。
一方、日本語では言語特性に依存する技術的な難易度の高さや公開されているデータ量が少ないという問題から、NLPの最先端技術の実用化が遅れていました。ELYZAは、この状況に問題意識を持ち、2020年にBERT以降の大規模言語モデルと弊社独自の大規模データセットを活用した日本語特化AIエンジン「ELYZA Brain」を開発しました。その後、「ELYZA Brain」の改良を行いつつ、日常・ビジネスの場でよく発生する「要約」という問題設定に特化し、この度、要約AI “ELYZA DIGEST” を公開するに至りました。
煩雑で難易度が高い「対話テキストの要約」に挑戦
“ELYZA DIGEST” は、大規模言語モデルを用いて高精度な生成型要約モデルを作る試みとなります。結果として、AIによる要約でよく扱われるニュース記事などに対して、 “ELYZA DIGEST” により、従来より高精度に要約文を生成することが可能になりました。
ELYZAでは、さらなるチャレンジとして、「対話テキストの要約」の実用化に挑戦しております。ニュース記事と比較し、対話テキストの要約は主に下記の4つの要因から難易度が高いとされています。
1. 口語のため、文の構造が大きく崩れていることが多い
2. 音声認識の失敗による誤字脱字の存在
3. 話者が複数存在
4. 対話トピックが多様
AIを用いた要約には従来から複数のアプローチがありますが、対話テキストの要約において、文中から一部を抜き出す「抽出型」や「圧縮型」、もともと用意したテンプレートの一部を置き換える「テンプレート型」では、上記の要因が障壁となり精度の高い要約は難しくなっています。一方、“ELYZA DIGEST” で採用している「生成型」のアプローチでは、一から柔軟に要約文を生成できるため、これらの課題を解決できる可能性があります。
実際に “ELYZA DIGEST” を用いて対話テキストを要約した例が下図になります。この例を見ると、口語特有の「あのー」、「えーと」などの間投詞や、音声認識のミスがあっても、妥当な要約文を生成できていることがわかります。
「対話テキストの要約」を実用化するための第一歩として、SOMPOホールディングス株式会社と提携し、グループ会社の損害保険ジャパン株式会社のカスタマーセンターにおけるる対話要約の作成業務の支援に取り組んでまいります。