THE BRIDGE

タグ Alexa

アマゾンのAlexaがユーザーの声の自動認識をスタート、さらなるパーソナライゼーションへ

SHARE:

アマゾンは17日、AIアシスタントのAlexaが、ユーザーが「Alexa、Play music」と言えば自動的にユーザーの声を認識するようになることを発表した。 このフレーズを発して自動の声本人確認ができると、アマゾンミュージックのパーソナライズセレクションに役立てられる。自動ボイスIDは、Alexaのアプリの設定でオフにすることもできる。 Alexaのボイスプロファイルを設定することで、音楽を再…

Photo by Andres Urena on Unsplash

アマゾンは17日、AIアシスタントのAlexaが、ユーザーが「Alexa、Play music」と言えば自動的にユーザーの声を認識するようになることを発表した。

このフレーズを発して自動の声本人確認ができると、アマゾンミュージックのパーソナライズセレクションに役立てられる。自動ボイスIDは、Alexaのアプリの設定でオフにすることもできる。

Alexaのボイスプロファイルを設定することで、音楽を再生する、メッセージを送信する、ショッピングの際に決済を完了させる、といったときに4桁のピンコードを入力することなしにユーザーはパーソナライズされた結果を得られるようになる。「Alexa, play music」コマンドを使った際の自動声認識の効果は、アマゾンミュージックからパーソナライズされた曲を再生できることに限定される。

パーソナライズされた結果を得るために、自分の声を認識するようにAlexaに教える機能については、昨年10月に初めて発表された。以来、アマゾンはユニークなボイスプロファイルを簡単に作れるように試みていた。

ボイスプロファイルを作るためには、これまではAlexaのアプリを使う必要があったが、Echoスピーカーを使ったプロファイル作成は2月に初めて登場していた。

ボイスプロファイルを作成するのに必要とされた以前の手順は、10のフレーズをユーザーが読み上げることだった。アマゾンの広報担当者は、声を認識するために何度Alexaをトレーニングする必要があるのかについては詳細のコメントをしなかった。

音楽などのパーソナライゼーションのほか、アマゾンはユーザーがAlexaに話しかけたときの気分をよりよく理解するための取り組みを行なっている。将来、さらなるパーソナライズされた経験へとつながるようなものだ。

関連ニュースとして、開発者はAWS PollyからAlexaとは異なる8つの人間のような声を追加できるようになった。また、今月初旬には、ボイスアプリのスキル購入が可能になり、外部の開発者や事業者も米国内の何百万というAlexaのユーザーから支払いを受けられるようになった。

アマゾンのAlexaは、一家庭につき10までの声を認識することができる。

【via VentureBeat】 @VentureBeat
【原文】

----------[AD]----------

Siri、Alexa、Googleアシスタント——人には聴こえないコマンドで作動できることが研究で明らかに

SHARE:

アップルのSiri、アマゾンのAlexa、グーグルのAssistantは、人の声によって制御できるようになっている。だが、この3つのAIアシスタントはどれも人間の耳が検知できない類の隠れたコマンドに敏感であることが、中国と米国の研究者によって明らかになった。 10日付のニューヨークタイムズの記事は、ラジオの音楽やYouTubeの動画、さらにスピーカー越しのホワイトノイズなどにも含まれる超低周波のコ…

上:Alexa とGoogle Assistant
Image Credit: David McCabe

アップルのSiri、アマゾンのAlexa、グーグルのAssistantは、人の声によって制御できるようになっている。だが、この3つのAIアシスタントはどれも人間の耳が検知できない類の隠れたコマンドに敏感であることが、中国と米国の研究者によって明らかになった。

10日付のニューヨークタイムズの記事は、ラジオの音楽やYouTubeの動画、さらにスピーカー越しのホワイトノイズなどにも含まれる超低周波のコマンドによって、AIアシスタントが制御される可能性があり、ユーザーにとって大きなセキュリティリスクになる可能性があることを報道した。

この記事によると、人間がテキストの読み上げや音楽の録音といったまったく異なる内容を知覚している際に、AIアシスタントに電話をかける、ウェブサイトを立ち上げる、購入をする、ドアロックなどのスマートホームアクセサリーにアクセスできるといった動作をさせることができるという。7.6メートル離れたビルの開いた窓からコマンドを送って、AIアシスタントに写真の撮影やテキストメッセージの送信を指示することもできたという。

バークリーの研究者は、オーディオファイルを少し変えて、「会話認識システムが聴きとるはずのサウンドを遮断して、人間の耳がほとんど知覚できない形でマシーンによって書き換えられたサウンドに置き換える」ことが可能だった述べた。プリンストン大学と中国の浙江大学の研究者たちはさらに、AIデバイスを最初にミュートにして、それ自身の反応もユーザーに聴こえないようにして同様の試みをした。

新しいのは、秘密のコマンドが聴き取れないという特性を有する点だ。テレビ番組やコマーシャルは言語化されたフレーズによって特定のデジタルアシスタントをオープンかつ故意に作動させていたが、そのフレーズを隠すことは音声版サブリミナル広告のようなものだ。

現時点ではAIデバイスを隠れたフレーズで作動させることを規制する法律は存在しないが、法律上の直接的な対応がなければ、そうした行為が悪用される可能性もある。

このセキュリティの問題がまだ十分に解決しなければーー今後解決することはほぼ間違いないもののーー不正利用の件数が大きな数になる可能性もある。

この3つのデジタルアシスタントについては、どのメーカーもこの点の脆弱性については既に気づいているものの、既存の緩い状態についてはっきり説明していない。

アマゾンは、Echoの安全性を確実なものにするべく対策を取ったといっており、グーグルは検知不可能なコマンドの力を弱める機能がAssistantにあるといった。アップルは、特定のコマンドを不可にする制限と予防措置があるといっている。

超低周波音のフィルタリングだけでこの問題が解決できるかどうかは明らかではないが、シンプルなソフトウェア修正プログラムでこのリスクを除去できる可能性は多いにある。

【via VentureBeat】 @VentureBeat
【原文】

----------[AD]----------