BRIDGE

タグ Amazon Alexa

Amazon Alexa、より自然な口調でテキストを読み上げられるように

SHARE:

Amazonは4月16日、サードパーティが提供するAlexaスキル(音声アプリなど)のニュースや音楽コンテンツ向けに、長文用の口調スタイルを発表した。ウェブページや記事、ポッドキャスト、ゲームのストーリーなどといった多様なテキスト情報に対応しており、米国の開発者は今週(4月第3週)から利用開始できる。 テキストをより自然に読み上げ、ユーザのエンゲージメントを上げることで体験の向上が見込まれる。加え…

Amazon Echo Dot Clock
Image Credit: Khari Johnson / VentureBeat

Amazonは4月16日、サードパーティが提供するAlexaスキル(音声アプリなど)のニュースや音楽コンテンツ向けに、長文用の口調スタイルを発表した。ウェブページや記事、ポッドキャスト、ゲームのストーリーなどといった多様なテキスト情報に対応しており、米国の開発者は今週(4月第3週)から利用開始できる。

テキストをより自然に読み上げ、ユーザのエンゲージメントを上げることで体験の向上が見込まれる。加えて、プロの声優を雇う必要がないので開発者にとってはコスト削減になり、スタジオでレコーディングするよりも時間の節約になる。

Amazonによると、この長文用の口調スタイルは、AIによるテキスト読み上げモデルを採用しており、段落と段落、セリフとセリフのあいだに自然な間が組み込まれている。同様に、Googleアシスタントにも最近、webサイトやAndroidアプリ内でより自然で人間らしい音声で長文コンテンツを読み上げる機能がローンチされた。

聞いてみてほしい。(編集部注:音声データは原文サイトをご確認ください)

【音声1】

こちらがAlexaのデフォルトスタイルだ。

【音声2】

長文用の口調スタイル以外にも、開発者はAmazon Pollyのニュース読み上げ・会話スタイルを利用することができる。Amazon PollyはAmazonのクラウドサービスの1つで、テキストを生き生きとした音声に変換するサービスだ。Alexaスキルの言語は29カ国語に対応しており、声質はMatthew、Joanna、Lupeから選ぶことができる。ニューススタイルはまるでテレビのアナウンサーやラジオのパーソナリティが話しているかのように聞こえる。会話スタイルの場合は堅苦しさがなく、あたかも友達や家族と話しているかのようだ。

昨年、AmazonはAIによって生成された音声に関する詳細な研究論文を発表した。声優が身に付けるには数十時間はかかるであろう口調スタイルを、わずか数時間のトレーニングで習得することができるシステムについて述べている。同社のモデルは、一連の音素をスペクトログラムに変換する生成系ニューラルネットワークからなり、時間軸に沿って変化する音声周波数のスペクトラムを視覚的に表現する。そうしたスペクトログラムを連続的なオーディオ信号に変換するボコーダもついている。

ひいては、AIモデルによって、大量のニュートラルな話し方の音声データと特定の話し方による数時間程度の音声データを結びつけるトレーニング方法を生み出し、口調スタイルとは無関係な要素と固有な要素の両方を識別できるAIシステムを開発している。Amazonはこれを利用してAlexa用の新ボイスやAmazon Pollyで多言語に渡る開発者向けボイスを制作している。

最後に、Amazonによると、Alexa用音声アプリの開発者は、アメリカ英語、アメリカスペイン語、カナダフランス語、ブラジルポルトガル語など、6つの言語による10種類の音声をAmazon Pollyから追加で使用することができる。

これらの開発に先立ち、AmazonはAlexaスキル用の口調として「うれしい・わくわくする」、「がっかり・同情」、短めのニューススタイル、音楽スタイルをリリース。11月にはブログで、感情をもたせた音声によってAlexaの標準音声よりも顧客満足度が30%上昇し、ニューススタイルおよび音楽スタイルについては自然度がそれぞれ31%、84%上昇したとしている。

Amazonは最近、AIを駆使して特注の話者を生成するAmazon Pollyの機能、「Brand Voices」もローンチした。このサービスでは顧客と社内エンジニアが協同して特定のペルソナを表す音声をAIで作り上げる。たとえばカナダのKFCには南米なまりの口調、ナショナルオーストラリア銀行にはオーストラリア英語といった具合だ。

【via VentureBeat】 @VentureBeat

【原文】

2018年上半期スマートスピーカー出荷台数は1680万台で187%成長ーー教育機関に拡大するAmazon、支援プログラムを14の大学に提供

SHARE:

ピックアップ:Amazon’s Alexa Fund Fellowship adds 14 more universities via VentureBeat ニュースサマリ:AmazonはAlexa Fund Fellowshipの提供範囲をMIT(マサチューセッツ工科大学)、ケンブリッジ大学、ダートマス大学など14の大学に拡大したことを発表した。参加する教育機関は、音声技術の新たなアプリケーシ…

black amazon echo on table
Photo by Fabian Hurnaus on Pexels.com

ピックアップ:Amazon’s Alexa Fund Fellowship adds 14 more universities via VentureBeat

ニュースサマリ:AmazonはAlexa Fund Fellowshipの提供範囲をMIT(マサチューセッツ工科大学)、ケンブリッジ大学、ダートマス大学など14の大学に拡大したことを発表した。参加する教育機関は、音声技術の新たなアプリケーション、会話型AIの開発推進、会話体験の作り方などを教育するための資金支援が得られる。

話題のポイント:音声コントロールの入り口、AlexaとAmazon Echo(dot)については、大学などの教育機関への導入や連携が強化されているようです。例えばセントルイス大学には校内に2300台のEcho dotが配置されるそうで、例えば図書館の利用時間など大学に関する情報がカスタマイズされて提供されます。

教育機関で利用を促進させることで、新しいイノベーションの可能性を模索するのが狙いにあるのでしょう。

新たに追加されるAlexa Graduate Fellowshipは、音声認識やテキスト音声変換に関連する機械学習など、ボイスコンピューティングに不可欠な課題に取り組む博士課程学生や博士後期課程の学生向けプログラムだそうです。またもうひとつのAlexa Innovation Fellowshipは、大学キャンパスにおける起業家センターの推進を実施します。

世界のスマートスピーカー市場はこちらのレポートによると、2018年Q2累計で1680万台出荷、前年度比で187%成長を続ける成長市場です。

Amazon EchoとAlexaにもし「Q&A広告」が入ったらーースマートスピーカー新たなビジネスモデルの可能性とその怖さ

SHARE:

<ピックアップ:This could be the way Amazon makes more money with Alexa> みなさんスマートスピーカー使ってますか? 昨年末から国内でも昨年末あたりから販売が始まって、こちらの国内ネット調査では認知率も7割と「ああ、なんかアレでしょ、スピーカーに喋りかけるやつ」ぐらいには知られるようになっているようです。 私もGoogle Hom…

40699742711_c88d467549_z.jpg
Photo credit: Robert Couse-Baker on VisualHunt.com / CC BY

<ピックアップ:This could be the way Amazon makes more money with Alexa>

みなさんスマートスピーカー使ってますか?

昨年末から国内でも昨年末あたりから販売が始まって、こちらの国内ネット調査では認知率も7割「ああ、なんかアレでしょ、スピーカーに喋りかけるやつ」ぐらいには知られるようになっているようです。

私もGoogle Homeを使っていますが、毎朝の天気予報を聞いたり、ラジオや音楽をかけてもらったりとなんだかんだ使わない日がないようになってます。実感値としては「スゲー便利!」というより、日常に溶け込んでいて、なくても困らないけどあったらまあ使うわ、ぐらい。

一方でそのビジネスは相当の市場規模が見込まれております。

例えばこの分野で先行するAmazonについては、2016年後半にベゾス氏が「第四の収益の柱」に育てると宣言しており、まだ確定した公式数字はないものの、2017年第3四半期の決算レターで同氏が「customers have purchased tens of millions of Alexa-enabled devices(人工知能アシスタントAlexaが搭載されているデバイスは数千万台出荷されている)」と順調な成長をアピールしておりました。

ちなみに調査会社フォレスターなどの試算では2000〜2200万台ほどのAmazon Echoが2017年に出荷されたという調査結果がありますので、まあその辺りなのでしょう。

さておき、スマートスピーカー自体はある一定の市場を押さえることになるとして、そのビジネスはどのようなものが考えられるのでしょうか?これについてQuartzの記事にひとつ、面白い考察というか、Amazonに関する新技術の話題が載っていたのでそちらご紹介します。

「Alexa、この汚れ落とすのどうしたらいい?」

通常、Alexaはこの回答を持っていない。しかし、4月25日に披露された新たなデモでは、Alexaはその回答に興味がありそうな内容を含めて答えることができるようになるかもしれない、ということだった。

「Tide社製の汚れ落としはいかがでしょう」ーーこんな感じだ。(Quartzの記事より引用)

実際に披露された新機能の内容はこちらに詳細記載されているのでご興味ある方はご一読いただくとして、かいつまむと、Alexaにある「スキル」というアドオン機能を機械学習で探し当て、自動的に立ち上げるようにする、というものらしいです。

スキルは通常Alexaに自分で設定する必要があるのですが、数が莫大に増えているので検索が難しく、まあ、ざっくり言えばレコメンドしてくれるといったところでしょうか。(雑ですいません)

確かにこれができれば日々のQ&Aがビジネスチャンスに変化します。企業側はスキルを作ってAlexaのプラットフォームに登録し、ユーザーがそれを利用して自社の商品を購入してくれれば検索広告と同じ理屈になります。

ただ、同時に怖くもあります。

おそらく利用ユーザー側の情報(日々の買い物情報やプロフィールなど)を参照してそれに近い商品やサービスをレコメンドしてくることになるので、例えば冒頭の例で言えば、日本人にはTide社ではなく、国産のメーカーがおすすめされることになるでしょう。しかしそれが広告費を積み上げただけの粗悪メーカーだったらどうでしょう。

もちろんレビューなどの評価でその排除をするというのが回答になるんでしょうが、どういうロジックでスキル(この例で言えば、Tide社の製品情報を渡すという機能)を選び出すのかについては気になるところです。

大分思考が飛躍しましたが、これらはまだテストケースとして公表されたばかりのものですので、実際の生活に登場するのはまだ先の話です。ただ、スキルの検索とレコメンドは間違いなく実装されるでしょうから、出てこないことはないでしょう。

文字ベースの検索結果と異なり「声」という情報は一覧性がありません。選択させるというよりは「おすすめ」しやすいツールとも言えるので、これまでと違った頭で情報や検索結果と向き合う必要が出てきそうです。

via Quartz

音声アシスタントはAIスピーカーの外へ飛び出す【ゲスト寄稿】

本稿は、VR や音声インターフェイスなどの先端テクノロジーを活用した UX/UI 領域で事業展開している、WHITE の CEO 神谷憲司氏による寄稿である。 「AIスピーカーが私たち暮らしをどう変えるのか」をテーマに、主に海外先行事例やAIスピーカー界隈のスタートアップの紹介と、そこから予測される日本市場での活用方法などを解説していただく。 10月頭に Google Home が日本で発売され、…

本稿は、VR や音声インターフェイスなどの先端テクノロジーを活用した UX/UI 領域で事業展開している、WHITE の CEO 神谷憲司氏による寄稿である。

「AIスピーカーが私たち暮らしをどう変えるのか」をテーマに、主に海外先行事例やAIスピーカー界隈のスタートアップの紹介と、そこから予測される日本市場での活用方法などを解説していただく。


Alexaが動作するアマゾンのデバイス。左から、Echo Dot、Amazon Tap、Amazon Echo
Image Credit: Ken Yeung/VentureBeat

10月頭に Google Home が日本で発売され、LINE の Clova WAVE も一般販売を開始した。読者の中には既に購入した人や、ネットに上がったレポートを見て「自分も買ってみようか」と思った人も多いのではないだろうか。

前回の記事では、リビングルームに置かれ、生活者とさまざまな企業のタッチポイントとなる AI スピーカーを紹介した。それは、音声の入力に対して音楽や音声のコンテンツを返す、家庭内における情報ハブ、メディアという位置付けとしての AI スピーカーだ。

一方で、AI スピーカーは、家そのものがネットとつながり、頭脳を持ったロボットのようになる「スマートホーム」実現への入り口としても注目されている。

スマートホームといわれてすぐに思いつくものとしては、例えば照明を点けたり、エアコンの設定温度を変えたり、テレビのボリュームを変えたりといった操作を行うシーンだろう。情報やコンテンツをスピーカーから引き出すのではなく、「モノを制御する」という使い方だ。

アメリカの Amazon Skills Store には9月時点で20,000を超える Skill があるが、その中でも「Smart Home」カテゴリの Skill が28%と最も高い割合を占めている。日本でも名の知られたところで例を挙げるとすると、Philips 社の「Hue」というスマート IoT 照明システムを制御する Skill が多く使われている。

出典:Voicebot.ai

国産 AI スピーカーである Clova WAVE は赤外線コントロールに対応しており、従来リモコンで操作してきた家電ならデフォルトの機能で操作が可能だ。

Echo や Google Home の場合は Bluetooth を使う、あるいはインターネット経由で IoT 機器を制御するということになる。

IoT 機器というくくりなら、コントロールする製品は家庭内だけにとどまらない。Amazon Skills Store には「Connected Car」のカテゴリもあり、Ford、Mercedes、BMW、Tesla、Hyundai、日産など自動車メーカー各社が Skill を提供している。家にいながらEchoを通じてリモートでエンジンをかけたり、車内のエアコンを調節したりといったことが可能になる。

さらに、Ford、BMW、日産などの自動車メーカーは車自体に Alexa を搭載することを発表している。年内から2018年に実装が見込まれる。今年の1月に公開された Ford の動画(以下)が、Alexa を搭載したクルマの便利さを上手く表現している。

確かに、家の外でありながらもプライベートな空間という意味で自動車は「家」に近いし、運転で両手がふさがっていることを考えると、音声インターフェイスが最も本領を発揮すべき空間といえるかもしれない。

今でこそ、AI スピーカーというガジェットそのものが注目を集めているが、今後は「スピーカー」だけではなく、自動車のように他のさまざまな家電やデバイスに直接組み込まれていくことになるだろう。

今年1月にラスベガスで開催された家電見本市 CES では、Alexaを 搭載したデバイスが約700も登場したという。それらの製品は、照明器具やテレビにとどまらず、冷蔵庫、洗濯機、子ども用の玩具、ロボットなど、あらゆるジャンルにわたる。

Amazon では早くから Alexa Voice Service(AVS)を開発者向けに公開してきた。AVS とは、クラウドで音声認識や自然言語解析を提供し、さまざまなデバイスに「音声による操作」や「会話機能」を追加できるようにするサービスのことだ。

今年の8月には、サードパーティーが Alexa をより簡単に製品に組み込めるよう、開発キット(Alexa Voice Service Device SDK)を公開している。Amazon Echo が今年中に日本で発売されることは既に発表されているが、おそらく発売と同時に、AVS を利用した Alexa 対応製品が市場に出てくるだろう。

Google も、今年の4月にサードパーティー向けて Google Assistant SDK を公開した。家電・音響メーカーなど複数のサードパーティーが、Google Assistant を搭載する AI スピーカーを発表している。こちらも今後はスピーカーだけでなく、さまざまな家電・デバイスに組み込まれていくと考えるのが自然だろう。

そうすると今後、音声インターフェイスを使ったプロダクトを考える場合、「AI スピーカーの上で何をするか」ではなく、Alexa や Google Assistant などの音声認識エンジンをいかに使って、スピーカー以外のどんなプロダクトをつくるかが、一つのポイントになってくるのではないだろうか。

人工知能アシスタントAmazon Alexaが2020年までに検討すべき5つの事柄

Alexaは夕方、たいてい居間で鼻歌を歌っている。私がボイスボットを使ってバスケットボールの得点をたずねる度、人や場所というものが実に曖昧なものなのだという事実に直面する。 そしてボットを使えば使うほど、これを更に進化させるにはどうすればよいかと考える。そこでAlexaに一日中、役立ってもらうために必要になるであろう、5つの点をまとめてみた。 1.より多くの文脈上のヒントを提供する プロアクティブ…

bc6eb47bfb092960351b0a89300c94b3
Image by Sophia Baboolal via Attribution Engine. Licensed under CC0.
Alexaは夕方、たいてい居間で鼻歌を歌っている。私がボイスボットを使ってバスケットボールの得点をたずねる度、人や場所というものが実に曖昧なものなのだという事実に直面する。

そしてボットを使えば使うほど、これを更に進化させるにはどうすればよいかと考える。そこでAlexaに一日中、役立ってもらうために必要になるであろう、5つの点をまとめてみた。

1.より多くの文脈上のヒントを提供する

プロアクティブボイスボットはすでに2017年に「もの」になっている。天気を常に問う必要はない。ほとんどのボイスボットは自然に天候の変化に気付くか、またはちょうど良いタイミングで簡単に情報をまとめて伝えてくれる。

私が間もなく起こるであろうと期待しているのは、ボットが実際のアシスタントのようになることだ。Alexaが映画に出かけようとする時に激しい雨が降る予報を察知してレインコートを着るべきであると知らせる。このようなことは大きく期待されている。プログラムをつくることはさほど難しくないが、人がイライラすることなくタイムリーな情報提供をすることができるかといったバランスを適切に保つ必要がある。

2.テレビで見ているものを増強する

Alexaに夜のテレビ番組のエンターテイメントを補強してほしい。きっとうるさく感じるだろうということは分かっているが、私が見ているものに追加するということが基本的な考え方だ。実現する場合は関与のレベルを設定することができるはずだ。

例えばNBAのプレーオフを見ている場合、大きな逆転や誰かが記録を打ち立てたときにAlexaにいくつかの興味深い事実を提示させるよう微調整できるといいだろう。

3.実際の会話に参加する

AlexaとGoogle Assistantの最大の違いは、Alexaが文脈を理解していないことだ。「クリーブランドの天気はどうですか?」とたずねた後に「お薦めの博物館はありますか?」と聞くとAlexaの回答は得られないが、Google Assistantからは得られる。しかし、Googleでさえ配偶者の代わりをする準備は整っておらず、仕事中に休みの日のことを聞いてきたりする。

実際にはいくつかの文脈での質疑応答が必要なのだろう。私の人格、感情、私の能力についてAlexaにもっと知ってほしいし、バスケットボールに関する会話では、私はゴールデンステート・ウォリアーズが好きであることを知っているべきで、私がレストランについて聞いたら、私は辛い食べ物が嫌いだと把握しておいてほしい。

4.間違いを指摘する

私たちは本当に間違いを指摘してくれるボットが欲しいのだろうか?

正直言ってこれは本当に迷惑になるかもしれない。しかしコンセントを間違って配線したり、悪い場所に誘導したりすることはなくなるだろう。この場合もやはりプライバシーに関する議論はスキップしよう。ボットが私の会話に耳を傾けて何か誤りがあると言った場合、私はAlexaを歓迎するかどうかについては気に留めない。

例えば娘に腹痛があって、私が間違った市販薬を服用するよう話してる場面を想像してほしい。そんな時にAlexaが「代わりにTumsを服用すべきです」と指摘してくれたらどうだろうか。子供の病歴を知っていて、何らかの理由でPepto-Bismolを摂取するべきではないと言うかもしれない。ただし、こうした指摘は100%正確で有用な場合にのみ役立つ。

5.私のトーンに反応する

AIプログラマーにとっては難しいことだ。私がいつ、Alexaのことを煩わしいと思っているのか知った上で、話を止めて新しい情報を提供しないようにしてほしい。私たちは皆、いろいろなやり方で迷惑や怒りを表現しているので、このシナリオは現実とかけはなれているかもしれない。共感は難しいプログラミング上の課題である。しかしコメントや修正の挿入など、特定の機能については、情報提供といったような機能をいつ無効にすべきなのかを知ることが、ひとつのメリットとして挙げられる。

【原文】

【via VentureBeat】 @VentureBeat

Translated by MachineTranslation+Conyac

音声コントロールの利用は14%ーー次のAmazon EchoとDotがスクリーンを持つ理由とアンビエント・コンピューティングの到来

編集部注:著者のAaron Emigh氏はスマートホームカンパニー BrilliantのCEOと共同設立者である。 2017年は音声コンピューティングが主流となった年として歴史に名を刻み込むことになるだろう。 そのトップに立つAmazonは、わずか2年間で800万以上のEchosとDotsを販売し、Amazon Voice Services(AVS)プラットフォームを活用して、冷蔵庫からダンスロボ…

alexa
Above: Amazon Echo Dot/Image Credit: Khari Johnson

編集部注:著者のAaron Emigh氏はスマートホームカンパニー BrilliantのCEOと共同設立者である。

2017年は音声コンピューティングが主流となった年として歴史に名を刻み込むことになるだろう。

そのトップに立つAmazonは、わずか2年間で800万以上のEchosとDotsを販売し、Amazon Voice Services(AVS)プラットフォームを活用して、冷蔵庫からダンスロボットFord F-150(40年間米国で最も売れている車)にAlexaを組み込んでいる。

Google Homeなどの他のボイスコンピューティング製品と、今夏に期待されているApple Siriスピーカーの登場により、今年は2500万台以上の音声デバイスが出荷されることは間違いない。このような成長にもかかわらず、ボイスコンピューティングは、ユーザーの維持と新規開拓における幾つかの重大な問題をすでに示している。

Voice Labsの新しい調査によると、新しいスキルやアクションはわずか2週間でユーザーの97%を失い、1万件にわたるAlexaスキルの3分の2以上は複数のレビューがつかない。しかし、これはボイスコンピューティングが失敗しているわけではない。音声は来るべきアンビエント(環境)・コンピューティング革命の一部に過ぎないからだ。

「アンビエント・コンピューティング」とは、携帯電話やコンピュータなどの中間デバイスを必要とせず、存在する人が家に直接アクセスできるようにすることである。キッチンに立ち、Alexaに音楽を流したり電気をつけたりすることを頼むことがアンビエントコンピューティングを使ったことになる。(ちなみにこれら2つはAlexaの最も一般的な用途で、それぞれAlexaへのリクエストの30%以上を占めている)。部屋にいないときにモーションセンサーで消灯する照明や、ウォールキーパッドを使ってセキュリティシステムを作動させたりしたことがある場合もアンビエント・コンピューティングを使用していることになる。ボイス・コンピューティングは、周辺機器と直接やりとりすることができる多くの方法の1つに過ぎない。

ボイス・コンピューティングは天気予報を確認するなど、目的を明確に知っている場合にはとても役に立つ。しかしオプションのリストからの選択、情報のレビュー、または利用可能な機能の発見などには向かない。汎用のアンビエント・コンピューティングデバイスは、関連する利用の方法や消費者の好みにあった一連のインターフェースを有する。

ここから疑問がわく。コンピューティング能力の範囲内ではどのインタフェースが最も使用されるだろうか?私たちは最近、スマートホーム・コントロールパネルであるBrilliant Controlでテストしてみた。音声サービスをオンにした世帯の数千件の使用方法を分析すると、音声は14%、タッチが81%、モーション感知が約5%であった。

タッチが最も頻繁に使用されたのはなぜか?3つの要因があることが判明した。まず、シンプルさ。部屋に入って指で電気のスイッチをつけるのは簡単だ。第2に選択肢。音楽プレーヤーの曲やプレイリスト、チャンネルなどのオプションを選択する際には、画面操作ははるかに自然である。第3にインタラクティブなフィードバック。正しい明るさや音量が見つかるまで何度も指示をするよりも、指のスライドで音楽のライトまたはサウンドレベルの調整する方がはるかに早い。

ボイスコンピューティングには依然として役割はある。事実、Alexaが家庭内のより多くの部屋に使用できると言う簡単な理由から、ボイスコンピューティングの家庭での利用は全体的に増加した。ボイスコンピューティングは将来の家庭で重要な役割を果たすが、それ自体だけでは完全ではない。

次世代のAmazon Echoに画面が含まれている場合は音声だけではなく、より広い範囲のアンビエント・コンピューティングに効果的なインターフェイスを提供することになるだろう。これにより、ボイスコンピューティングが今日求めている発見とリテンションの課題を打ち破り、Amazonの優位性を確固たるものにするだろう。同社が最近発表した「ディスプレイカード」は、AVSパートナーに音声コマンドのビジュアルデータを戻す機能を付与することで、この方向に向かっていることを示している。

AlexaとAIエンジンのカメラを組み合わせて服を選ぶAmazon Lookデバイスは、Amazonの実行能力を証明している。Amazonがボイス、ディスプレイ、タッチ、ビジュアルにバックエンドのAIエンジンを組み込めることが出来ればエキサイティングな(そしておそらくシンプルな)インタラクションが生まれるかもしれない。これはアンビエント・コンピューティングをまったく新しいレベルに引き上げ、文字通りAlexaを家庭用にする。

2018年までに50%以上の家庭がスマートホーム関連プロダクトを導入するだろう。アンビエント・コンピューティングの完全な実現は、今日存在するめんどくさいスマホでの操作または音声のみのやりとりに頼ることなく、家との楽しい関係を築くことにつながる。

Amazonのような大企業からの製品だけでなく、当社のようなオープンなプラットフォームを使用している企業の製品でもこのことは予見される。さらにGoogleとAppleが第三者にプラットフォームを公開すれば、コンピューティング設備のない家庭が取り残された気分になる日がいかに早くやって来るかということに驚くことだろう。

携帯電話がシンプルな音声とテキストのデバイスから、数十億人の人々の日常生活をシンプルにする必須のデバイスになるまで8年しかからなかった。アンビエント・コンピューティングはすでに次の大きな波となる途上にある。

 

MI-3.0-Thumbnail-1-1
Above: The Machine Intelligence Landscape This article is part of our Artificial Intelligence series. You can download a high-resolution version of the landscape featuring 288 companies by clicking the image.

【原文】

【via VentureBeat】 @VentureBeat

Translated by MachineTranslation+Conyac

カメラが付いたAmazon Echo Look、これは音声アシスタントの正当進化だ

SHARE:

AmazonのEcho Lookはカメラ付きの音声アシスタンで実に正当な進化だ。 Amazonは本日(原文掲載日は4月26日)Echo Lookという新たなカメラ装備のAlexa対応デバイスをデビューさせた。この正当進化デバイスの価格は199ドルの予定だ。Echo Lookは写真を撮ったり、ライブビデオを電話で共有したり、ビデオを録画することができる。 スタイルチェック機能はスマート・スピーカーで…

echo-look-closet-shelf-e1493219970622
Above: Amazon Echo Look/Image Credit: Amazon

AmazonのEcho Lookはカメラ付きの音声アシスタンで実に正当な進化だ。

Amazonは本日(原文掲載日は4月26日)Echo Lookという新たなカメラ装備のAlexa対応デバイスをデビューさせた。この正当進化デバイスの価格は199ドルの予定だ。Echo Lookは写真を撮ったり、ライブビデオを電話で共有したり、ビデオを録画することができる。

スタイルチェック機能はスマート・スピーカーでカメラを楽しめる機能の1つだ。Echo Lookはコンピュータビジョンを使用して写真を撮り、スタイルのデータが蓄積された機械学習アルゴリズムの実行で、着用するシャツやドレスの意思決定サポートをしてくれる。ただ、現時点のニュースではAmazonはスタイルチェック・コンピュータビジョンの仕組みについて多くのことを伝えていない。

この機能はその他にもセキュリティなどの付加的な映像接続サービスを提案する。これらの写真をチャットやソーシャルメディアで友人と共有することで、A/BボットSwellyを一躍有名にした機能のように、カメラを備えたインテリジェントなアシスタントの魅力的な機能にもなりうる。

SkypeやFacebook MessengerのMode.aiのようないくつかのボットは、写真からファッションのアドバイスをしてくれる(Your Faceはコンピュータビジョンを使ってあなたを楽しませる)。ただ、こういった音声アプリはほとんどない。

Google Homeにはスタイリストもいる。Able Styleと呼ばれる音声アプリケーションは毎日メンズファッションのヒントを提供し、アシスタントがファッションアイデアや色の組み合わせを提案するウェブサイトを案内する。

【原文】

【via VentureBeat】 @VentureBeat

Amazon Alexaのスキルが1万を突破ーー人気トップ10のスキルとは?

SHARE:

Amazonは、Amazon Echoのようなデバイス上で利用可能なAlexaのスキルが1万を超えたことを発表した。昨年の1月にはおよそ130だったスキルが、昨年11月には5000を超えた。 チキンウィングを注文する、テキストメッセージを送信する、自動車を制御する、自尊心を高める… さまざまな目的のスキルがこれまでにつくられてきた。これらはすべて、Alexa Skills Marketplaceか…

上: Amazon Alexa
Image Credit: Ken Yeung/VentureBeat

Amazonは、Amazon Echoのようなデバイス上で利用可能なAlexaのスキルが1万を超えたことを発表した。昨年の1月にはおよそ130だったスキルが、昨年11月には5000を超えた。

チキンウィングを注文する、テキストメッセージを送信する、自動車を制御する、自尊心を高める… さまざまな目的のスキルがこれまでにつくられてきた。これらはすべて、Alexa Skills Marketplaceから利用、共有することが可能だ。

Amazonが外部の開発者が独自のスキルを作れるようにAlexaを開放したのは2015年6月のことだ。Alexa Skills Kitを使っている開発者の具体的な数については、数万人ということ以外に同社は言及を避けている。

人気の高いカテゴリーは(以下の順で)、ニュース、ゲーム、教育・辞典、生活、トリビア・ユーモア、であるとAlexaのチーフエバンジェリストのDave Isbitski氏はブログで述べている。

現在、Alexa Skills Marketplaceでユーザーからもっとも使用されているトップ10のスキルは以下の通りだ。

  • This Day in History日々の歴史学習コンテンツ。history.com のウェブサイトから集められた知識を元に作られている。
  • Short Bedtime Story:子供に対して1分程度、就寝時の読み聞かせをする。
  • Ambient:雷、海、雨の音のスキルを環境音楽として流す。ウェブデベロッパーのNick Schwab氏が開発。
  • Jeopardy! J6 :テレビ番組から着想を得てつくられた日々のクイズ。
  • Ditty:ユーザーが発した言葉をもとに曲をつくる。選択したテーマを元に、テンポの速い、または遅い曲を作ることができる。
  • Twenty Questions:ある一つの音楽、植物、物をユーザーに想像させ、スキルが20以下の質問を聞いて、それを当てるゲーム。
  • Curiosity:腐食の仕組みについてなど、世界における知的な情報を伝える。
  • Inspire Me :人間によって読まれる、日々の語録。

まだスキル数が100に達していないGoogle Assistantのようなライバルに比べると、外部開発者が作ったサービス数では圧倒的な数を誇るAlexaであるが、スキルごとにムラは大きい。モバイルアプリストアの黎明期のような感じである。

2017 Voice Reportによれば、AlexaのスキルとGoogle Assistantのたった3パーセントが、最初の1週間を経てもリピートして使われているということだ。

(本記事は抄訳になります。)

【via VentureBeat】 @VentureBeat
【原文】

Amazon「1000人規模」人工知能アシスタントチームは氷山の一角、AlexaとEchoグループで400職種の人員募集

SHARE:

<ピックアップ> Amazon’s Alexa group is on a massive hiring spree Amazonの人工知能アシスタント、Alexaとボイスコントローラー(兼スピーカー)のEchoですが、まだ日本に上陸してないこともあってあまり馴染みがないかもしれません。(かく言う私も手にしてないのでその便利さはまだ実感できてないですが) しかし海外在住の友…

%e3%82%b9%e3%82%af%e3%83%aa%e3%83%bc%e3%83%b3%e3%82%b7%e3%83%a7%e3%83%83%e3%83%88-2016-10-02-9-54-04

<ピックアップ> Amazon’s Alexa group is on a massive hiring spree

Amazonの人工知能アシスタント、Alexaとボイスコントローラー(兼スピーカー)のEchoですが、まだ日本に上陸してないこともあってあまり馴染みがないかもしれません。(かく言う私も手にしてないのでその便利さはまだ実感できてないですが)

しかし海外在住の友人などの声を聞く限りやはり便利、ホームコントローラーとしてはやはりECやサービスとの連携がある分、その他の単なるボイスコントローラーよりは一歩先を言ってる印象があります。前回も米みずほ証券のアナリスト予想でこのAlexaとEchoコンビが2020年までに110億ドル(単純に100円換算で1.1兆円)のビジネスになるという話題を掲載しましたが、それを更に後押しするような情報がありました。

人員の拡大です。

そもそもこの話題はAmazon創始者、ジェフ・ベゾス氏が米テック誌「Recode」のカンファレンスで大御所ジャーナリスト、ウォルト・モスバーグ氏の公開インタビューに対し、AlexaとEchoチームで1000人規模が稼働していることを明らかにしたことから始まっています。

人工知能アシスタント「Alexa」はAmazon第四の収益の柱になりうるーーベゾス氏が語る

残念ながらSiri(Apple)やコルタナ(Microsoft)、Google assistantの各チームがどれぐらいの人員を投入しているか公開されてる情報がないので多いか少ないかの単純な比較はできませんが、1000人のスペシャリスト達が働くチームを少ないと考えることはないでしょう。

さておき、そのカンファレンスでベゾス氏は「これはまだ氷山の一角」と話していたそうなのですが、それを裏付ける情報が公開されていました。Recodeが目ざとく発見した情報で、AmazonのAlexa関連の募集職種情報のページに約400件の職種が掲載されている、というものになります。募集内容はデータエンジニア、プロダクトマネージャーに機械学習サイエンティストなどなど。勤務場所も本社を始め、海外含めて各地にあります。

400「職種」ですから当然、人員数はその数倍に及ぶことになるのでしょう。

Alexa&Echoという組み合わせはKindleと同じく完全にAmazonオリジナルであり、また記事にも言及ある通り、ボイスコントロールによるショッピングというのは一つの機能にすぎません。ここを通じたサービス連携はもう既に始まっており、単純な「声」で完結できるような要素はどんどん巻き取っていくことになるのでしょう。

Amazonの「Alexa」とハイヤー配車「Lyft」が連携ーー迎えの予約、運転手評価やチップ支払いまで音声で

Amazon、Google、Apple、Microsoftによる声を通じたコントロール競争から目が離せなくなってきました。

via Recode

Amazon「第四の収益の柱」は2020年までに110億ドル稼ぐーー人工知能アシスタント「Alexa」と音声コントローラーの「Echo」

SHARE:

<ピックアップ> Amazon’s Echo and Alexa could add $11 billion in revenue by 2020 MacOSのSierraにアップデートした方であればMacbookなどのラップトップで音声アシスタント「Siri」を使ってみたんじゃないでしょうか?「シリ、keynoteファイル探して」と話しかけると本当に直近の候補を表示してく…

alexa_echo

<ピックアップ> Amazon’s Echo and Alexa could add $11 billion in revenue by 2020

MacOSのSierraにアップデートした方であればMacbookなどのラップトップで音声アシスタント「Siri」を使ってみたんじゃないでしょうか?「シリ、keynoteファイル探して」と話しかけると本当に直近の候補を表示してくれるのでなかなかの精度です。(まだ仕事で活用できる段階にはなってませんが)

家庭や車内、一部職場での音声コントロールの可能性というのはますます重要性が高まっており、照明のオンオフみたいな単純なオーダーからコマースを通じての「三河屋的」利用方法、個人の音声データの収集の先にあるパーソナルレコメンデーションなど夢は広がります。

そしてその急先鋒にいるのがAmazonのボイスコントローラー「Echo」とその人工アシスタントである「Alexa」です。残念ながら日本では発売未定ですが、このポテンシャルを予想する数字がBIに掲載されていました。アナリストとして予想を提示しているのが米国みずほ証券のNeil Doshi氏です。

彼の予想では2014年にEchoファミリー(EchoとDotの2タイプ)のデバイス売上で2400万ドルだったものが、2020年には約40億ドルに成長、さらにここから生まれるトランザクション(買い物Uber呼んだりする流通総額)が2016年から立ち上がり、こちらも2020年に70億ドルに到達するとしています。なお、Echoの出荷台数予想は向こう4年間で1億1300万台です。

BIの記事では同時にRBC Capitalの調査も掲載していて、Echo経由での注文を「よくする、たまにする」と回答したユーザーが26%いることも付け加えています。

なお、Amazonの創始者、ジェフ・ベゾス氏はAlexaが同社にとって第四の柱(Fourth Pillar)になると発言しており、1000名近くの人工知能関連の開発人員を投入していることで話題になりました。

人工知能アシスタント「Alexa」はAmazon第四の収益の柱になりうるーーベゾス氏が語る

このリサーチと調査結果については元情報を探してみたのですが公開情報がなさそうで、またBIはAmazonの創始者、ジェフ・ベゾス氏の個人投資会社が出資していることもあってややバイアスかかってるかもしれませんが、それでも具体的な数字があるとイメージがしやすいです。

特にトランザクション部分が2年後にはデバイス売上を越しており、この「音声コントローラー」の市場がコマースやサービスECといったプラットフォームと組み合わさることで伸長するであろう時期が数年ないに来ると予想されているのは注目すべき点かなと。

特に国内では「日本語」という特殊環境があるので、デバイスの開発時間などを含めて考えると、この流れに乗るEC、マーケットプレース事業者はもう動き出してるとみていいのではないでしょうか?

楽天、ヤフーを始め、ペパボやMakeshop、ZOZOにSTORES.jp、BASEにメルカリ、FRILとどこから音声コントローラー方面の動きが出てきてもおかしくない状況で誰が最初に手を挙げるのか、国内組の動きも興味深くウォッチしてみたいと思います。

via Business Insider