BRIDGE

タグ Amazon Lex

Amazon Lexを使用したボイスボット開発から学ぶ、7つの成功の鍵

編集部注:Michael Beemer氏はDynatraceのDevOpsエンジニアであり、DynatraceのAI対応デジタルパフォーマンスバーチャルアシスタントであるDavisのVoiceOps開発チームを率いている。 私は過去5カ月間で企業向けのAI対応VoiceOpsインターフェイスを開発した。当時はAmazon Lexを利用できなかったため、私のチームはプロジェクトをオープンソース化した…

amazon-alexa-echo
Above: Amazon Echo Image Credit: Carlos Delgado

編集部注:Michael Beemer氏はDynatraceのDevOpsエンジニアであり、DynatraceのAI対応デジタルパフォーマンスバーチャルアシスタントであるDavisのVoiceOps開発チームを率いている。

私は過去5カ月間で企業向けのAI対応VoiceOpsインターフェイスを開発した。当時はAmazon Lexを利用できなかったため、私のチームはプロジェクトをオープンソース化した。そして2月にはプロダクトローンチに成功した。現在では複数のカスタマーが使用しており、企業向けアプリの問題解決をする際、優先順位を決めるのに役に立っている。また最近ではLexを使用したベータテストを開始した。開発者がLexを広く利用できるようになったため、私は経験に基づいてアドバイスや成功事例を他の人にシェアしたいと考えた。

1.インテントスコープの制限

ボイスボットを構築するための基礎の1つに、話されたフレーズからユーザの意図を推測することがある。 私たちがすぐに気付いたことは、多くの関連するフレーズを単一の意図にまとめてしまうのを避けなければならないということだ。たとえば、当初は「今何か問題はありますか?」や「今週の旅行に影響するような問題が何かありましたか?」といった質問を同じ問題の意図にマッピングしていた。しかし、それはボットのロジックをオーバーロードしただけだった。より良いアプローチとは各意図の範囲を可能な限り制限することなのだ。

2.より自然な言語を使用する

多くの人はできるだけ沢山のフレーズを追加して、必要な情報を伝える文章を自然に話せるようにしたいと思うだろう。しかし、似ているが異なるフレーズが多すぎると言葉の分類を混乱させ、予期しない結果を招く可能性がある。我々は明確に特定のフレーズのサブセットをより小さくすることがはるかに良い方法であるとわかった。Lexは本物の自然言語よりも制限的だが、結果は一貫している。

3.状況に関する事項

特定意図とフレーズを一致させるのは簡単だが、文脈がなければ混乱してしまうかもしれない。たとえばユーザーがある質問に「はい」と答えた場合、ユーザが回答している質問を正確に把握するために、ボイスボットに十分な状況を把握させる必要がある。

4.アクセントと特別な単語に対応する

アクセントと異なる発音はボイスボットにとっては扱いづらい場合がある。私の経験からLexは中西部のアメリカ人アクセントに対しては最高の仕事をする。しかし、様々なアクセントを持つ人々の使用が想定されるアプリケーションはシステムを訓練するのに尽きる。ボイスボットを正確に訓練して、それぞれ特定のフレーズと発音を学習することによって、システムは目的の意図と一致させる方法を学ぶ。また特定の単語についても同じことが言える。たとえば当社の名前、DynatraceはLexの辞書にはない。”diner “または “Dinah “という名前に聞こえるため、言葉だけでなく発話時の言葉の使用に関連した具体的な行動や意図を認識するように我々はボットを訓練しなければならなかった。

5.拡張可能にする

ボイスボットの開発に成功する鍵は、潜在的な使用事例すべてに幅広くあらゆる方向に考えることだ。 自分自身を制限しないでほしい。

6.迅速かつ頻繁に失敗する準備をする

Lexにはたくさんのドキュメントがあるが、それらは技術的かつ大量なので実験したくないと感じるかもしれない。しかし良い知らせとしてはボイスボットの構築が複雑であるにもかかわらず、Lexはテストアプリを簡単に作成して動作するものと動作しないものを簡単に発見してくれるので、皆さんがやりたいように学ぶことができる。

7.将来を振り返る

Amazon Lexなど解析サービスのほとんどは、未来に関する意図を想定している。たとえばユーザーが「木曜日に何が起こったのですか」と言うと、その人は明らかに過去の出来事について尋ねている。しかし、Lexはそれを本質的に理解していない。これは、自然言語処理(NLP)の現状では難しい問題であり、Lex固有の問題ではない。Amazonのような企業がNLPに投資するようになると、時間枠をより明確に区別できるようになるのではないかと期待している。しかし一方で、時制を超特化することを開発者が考慮する必要がある。

MI-3.0-Thumbnail-1-1
Machine Intelligence Landscape この記事は、人工知能シリーズの一部である。ここをクリックすると、288社の高解像度バージョンをダウンロードできる。

【原文】

【via VentureBeat】 @VentureBeat

Translated by MachineTranslation+Conyac

AWS、Alexaを強化するボットフレームワーク「Amazon Lex」をローンチ

SHARE:

ついにこの時がきた。ディープラーニングとよばれるある種の人工知能(AI)に対する関心がここ数年高まっていたところ、世界最大のパブリッククラウドインフラプロバイダーの Amazon Web Services(AWS)は本日(11月30日)、ディープラーニングを活用する初の Amazon AI サービスを発表した。 ディープラーニングとは一般的に、写真など大量のデータで人工の神経ネットワークをトレーニ…

(上)Amazon Lexで可能になることのデモンストレーション Image Credit: Screenshot
(上)Amazon Lex で可能になることのデモンストレーション

Image Credit: Screenshot

ついにこの時がきた。ディープラーニングとよばれるある種の人工知能(AI)に対する関心がここ数年高まっていたところ、世界最大のパブリッククラウドインフラプロバイダーの Amazon Web Services(AWS)は本日(11月30日)、ディープラーニングを活用する初の Amazon AI サービスを発表した。

ディープラーニングとは一般的に、写真など大量のデータで人工の神経ネットワークをトレーニングし、新たなデータの類推をさせるものである。AWS にとって最大の競合である Google Cloud Platform は今年初め、ディープラーニングを行う Cloud Machine Learning サービスを導入した。中国では Alibaba のパブリッククラウドが、AI ワークロードで利用できる DT PAI サービスを提供している。また、Clarifai などのスタートアップもクラウドベースのディープラーニングサービスを提供している。

しかし AWS は今のところベーシックな汎用 AI サービスを提供しているわけではない。

Rekognition という新たな画像認識サービスは、おそらくAmazon が昨年に買収した Orbeus というディープラーニングのスタートアップが持つ人材とテクノロジーから生まれたものだ。

他にも、Polly というテキスト読み上げ(text-to-speech: TTS)サービスがあり、これは47ボイス、24言語をサポートしている。利用料は月500万文字までは無料、それ以降は文字当たり0.000004米ドルであると、AWS のチーフエバンジェリストである Jeff Barr 氏はブログで述べている。

しかし今日(11月30日)の発表で最も際立っていたのは Amazon Lex のローンチだ。これは Amazon の音声バーチャルアシスタント Alexa の基礎となっているテクノロジーである。Alexa は、Amazon Echo というスマートスピーカーのラインナップの基礎となるもので、最近のレポートによると、Amazon はこれを500万台以上販売し、売上好調だという。Lex にはディープラーニングで動作する自動スピーチ認識と自然言語の理解機能が備わっている。

AWS のチーフエグゼクティブ Andy Jassy 氏はラスベガスで開かれた AWS の re:Invent ユーザカンファレンスの本日(11月30日)の基調講演で次のように述べた。

これを使えばあらゆる種類の会話アプリが作れます。文字か音声の一部を提供し、(その入力に対する)反応を指定すると、反応を返してくれるのです。

Facebook Messenger のようなアプリ上にあるチャットボットや、いずれはチャットツールの Slack にも使うことができるだろう。しかし同時に、デベロッパーが既存のデータレポジトリを利用することにもなる。データレポジトリには Salesforce、Microsoft Dynamics、Marketo、Zendesk、Quickbooks、Twilio、HubSpot とのコネクターがあると Jassy 氏は述べた。AWS の Lambda というイベントドリブンのコンピューティングサービスで構築されたトリガーをサポートすることも可能だ。

チャットボットは2016年で最も人気のテクノロジーとなっている。Facebook と Microsoft は今年、チャットボット構築のためのプラットフォームを明らかにしているが、最大のクラウドプロバイダーである Amazon も両社に追いつこうとしている。

このサービスは、AWS データセンターリージョンのうち米国東部(バージニア北部)リージョンでのみプレビュー利用が可能となっている。使用料については、月あたり10,000文字のテキストリクエストと5,000スピーチのリクエストまでは無料で、 それ以降は千単位のスピーチリクエストで4米ドル、千文字単位のリクエストで75米セントが課金されると Barr 氏はブログに投稿している。

AWS はある程度自社情報をこれまで明らかにしていた。6月にワシントン DC で開かれた AWS の Public Sector Summit の壇上インタビューで Jassy 氏は、「数ヶ月以内」に AWS がディープラーニングサービスを発表すると話していた。今月(11月17日)には Information 誌が AWS によるディープラーニングサービスのローンチを、Fortune 誌も先週(11月22日)AWS がデベロッパー向けにさらに強力な AI ツールを発表すると報じていた。

AWS はこのサービスのための地ならしをしてきた。Amazon は5月に DSSTNE のディープラーニングフレームワークをオープンソース化し、今月(11月)初めには AWS が選択するディープラーニングのフレームワークは MXNet であって DSSTNE ではないと発表していた。

【via VentureBeat】 @VentureBeat

【原文】