BRIDGE

タグ Siri

なぜSiriは使われないのか?

SHARE:

最近、音声プロダクト開発に向けていろんな人に会わせていただきながら、ざっくりと音声アシスタント(Siri・Google Assisntant・Alexa)の利用状況を聞く機会が増えました。(※本記事は.HUMANS社が運営するメディア「 THE .HUMANS MAGAZINE」からの要約転載) 膨大なボリュームを調べていないため反論もあると思いますが、結論から言うとSiri(もしくはGoogle…

Screen Shot 2020-03-06 at 9.59.07 PM
Image Credit: Apple

最近、音声プロダクト開発に向けていろんな人に会わせていただきながら、ざっくりと音声アシスタント(Siri・Google Assisntant・Alexa)の利用状況を聞く機会が増えました。(※本記事は.HUMANS社が運営するメディア「 THE .HUMANS MAGAZINE」からの要約転載)

膨大なボリュームを調べていないため反論もあると思いますが、結論から言うとSiri(もしくはGoogle Assistant)を日常的に使う人はほとんど見当たりません、今のところ。

ここで言う「日常」とは、日々持ち歩くスマホやスマートイヤホン経由で音声アシスタントを少なくとも毎日、2〜3度以上は起動・利用するシチュエーションを指します。

肌感としては自宅でEchoシリーズを使っている方が5人に一人の割合、スマホの音声アシスタントを日常的に利用する人は数十人に一人くらい。ちなみにAlexaはスマホには進出していないため、自宅ユースケースが大半です。Google Assistantもスマートホーム文脈が比較的強いため、持ち歩き外出シーンではあまり使われていない印象でした。AppleのHome Podはほとんど普及していないため、Siriは完全にスマホ利用を想定しています。

日本と音声アシスタントの相性

pexels-photo-699122
Photo by Tyler Lastovich on Pexels.com

なぜ日常的にSiriやGoogle Assistantを使うユーザーにヒットできないのか。私が人を選んで会っていないという理由を除き(選ぶと市場の俯瞰的な定性データが集まらない)、2つほど仮説を立てました。

1つはお国柄。

まず音声アシスタントの利用シーンとして考えられるのは移動時間。しかし、日本(特に公共交通機関が発達した首都圏)では欧米のように、音声やオーディオサービスの価値が発揮されるプライベートが担保された自動車空間にいることがあまりありません。電車内で声を出すこともエチケット違反であると感じるため、使いところはないでしょう(この点、唯一タクシーや自転車移動を頻繁にされる方には刺さるかもしれませんが)。

加えて、タイピング文化が日本に追い風なのも特徴です。

フリック入力文化もあり、高速でGoogle検索できます。メッセージアプリもテキスト入力が比較的多いと思います(要検証項目ですが)。一方、中国ではタイピングフォーマットと言語がマッチしない理由から、音声メモを送り合う文化が形成されていると聞きました。欧米では先述したように、自動車空間に縛り付けられる拘束時間があるため、両手を使うテキスト入力が音声に代替されることに合点がいきます。

まとめると、「日本ではそもそも音声を発する場がない」「タイピング文化がフィットし過ぎている」が1つ目の仮説です。

逆に言えば次の3つのターゲットは1つ目の仮説を反証してくれると考えています。ただ、非常にニッチなのは否めないかもしれません。

  • 音声を発することにためらいをあまり感じない、デジタルネイティブな10代を中心とした「若者世代」
  • 比較的勝手に声を発しても許されるタクシー移動空間や、忙しなく仕事をして多量のタスクを処理する必要性に駆られている「ビジネスプロフェッショナル層」
  • プライベート空間が保たれ、常にパソコンを見つめながら作業をしてスマホを随時チェックする作業に多少の煩わしさを感じる「リモートワーカー層」

ボイスファースト時代の「コミュニケーション・キャズム」

pexels-photo-1647962
Photo by Valdemaras D. on Pexels.com

では、どうすれば音声アシスタントは使われるようになるのでしょうか。

そこで考えたいのが「コミュニケーション・キャズム」です。これは音声アシスタントの利用を多くの人が躊躇してしまう根本的なUX上の問題を指します。

従来のモバイルでは「アプリを開く→特定サービスを受ける」という導線でした。しかし、⾳声コマンドでは「要望を伝える→サービスを受ける」の導線へと変わります。つまり、サービス名やブランドに価値がなくなる世界観があるのです。これまでスマホ画面をタップしてサービスを指定していた習慣を変える必要があるので、ここでキャズムの概念が適応されるのです。

市場には、イノベーター(革新者)・アーリーアダプター(初期採用者)・アーリーマジョリティ(前期追随者)・レイトマジョリティ(後期追随者)・ラガード(遅滞者)の5タイプのユーザーがおり、順にプロダクトを利用するとされています。アーリーアダプターとアーリーマジョリティの間にある“崖”を超えれば、製品利用が爆発的に増える概念です。

スマホの音声アシスタント利用に関しては、イノベーター層は一定数存在すると踏んでいます。なんとかしてSiriやGoogle Homeの活用方法をハックして、自宅でEchoシリーズを使うように工夫する人がいるはず。もしくは音声メモをMessengerやSlack、LINEに頻繁に使ったり、私のように記事執筆の書き起こしに使う人がいるでしょう。

彼らはボイスファースト時代のサービス導線を自ら作る、学習コストの高いサービスを独自に工夫したりして自分なりの利用方法を開拓するイノベーターおよびアーリーアダプタ層「ProConsumer」です。

鶏と卵問題

pexels-photo-3781570
Photo by Andrea Piacquadio on Pexels.com

ProConsumerたちは音声の良さを最大限享受し、恩恵を受けています。しかし、私たちが使うほとんどのサービスがモバイルアプリ体験から⾳声体験へシフトができていないことから、キャズムを超えられていません、爆発的に音声の良さが伝わっていません。

ユーザーにとって⼊⼒やサービスが呼び出しが楽にも関わらず、なぜ⾏われていないのか?

もともと音声は人間が本来持つコミュニケーションであり、ストレスなく情報を入力・取得できるものであるはず。にも関わらず、なぜ体験シフトへ動かないのか?

答えは2つ挙げられます。1つは「鶏と卵の問題」。サービス開発者は市場からの強いニーズがあれば音声体験への最適化へ必然的に動きますが、未だに少数しか音声を使いこなせていません。この堂々巡りが市場を硬直させていると感じます。

ただ、一石を投じたのがAirPodsです。耳元にSiriを持ってきた高性能イヤホン「ヒアラブル」端末の急先鋒として市民権を得ています。AirPodsは硬直状態の市場を少しずつ動かすはずです。

シークレットクエスチョン

pexels-photo-132340
Photo by Burak K on Pexels.com

ここ数年で発生したハードウェアの進出・利用浸透でもなお、シフトが発生しないのはなぜか。それが2つ目の答え「シークレットクエスション」、つまり今は誰もが当たり前に受け入れている問題のことです。

PCからモバイルへと体験がシフトしただけで、インスタグラムやUberなど、潜在的な課題を解決する様々な巨大企業が誕生しました。シークレットクエスチョンにはそれほどのインパクトがあるのです。

何かしら大きな市場がキャズムの先にあるにも関わらず、私たちは未だに制限された音声体験を当たり前に受け止めています。長年使い続けた、生産性の低いタイピングでカバーしようと自然と考えてしまっています。これが私が考え、気付いたシークレットクエスションです。

将来的にFacebookやAppleが開発に注力するARグラス端末が増えれば、音声アシスタントを通じたコミュニケーション手法は主要UIとして採用される可能性が高いです。まさにSF映画のように、音声コマンドだけであらゆるサービスを利用できる環境が2020年代に整うかもしれません。

その下地をモバイルファースト時代に作っておくことで、戦略的に次世代ハードウェアが活躍する「Spatial Computing時代/ミラーワールドが実現された世界」へと打って出ていけると考えています。

本稿は次世代コンピューティング時代のコミュニケーションデザイン・カンパニー「.HUMANS」代表取締役、福家隆氏が手掛ける「 THE .HUMANS MAGAZINE」からの要約転載。Twitterアカウントは@takashifuke。同氏はBRIDGEにて長年コラムニストとして活動し、2020年に.HUMANS社を創業した

Siri、Alexa、Googleアシスタント——人には聴こえないコマンドで作動できることが研究で明らかに

SHARE:

アップルのSiri、アマゾンのAlexa、グーグルのAssistantは、人の声によって制御できるようになっている。だが、この3つのAIアシスタントはどれも人間の耳が検知できない類の隠れたコマンドに敏感であることが、中国と米国の研究者によって明らかになった。 10日付のニューヨークタイムズの記事は、ラジオの音楽やYouTubeの動画、さらにスピーカー越しのホワイトノイズなどにも含まれる超低周波のコ…

上:Alexa とGoogle Assistant
Image Credit: David McCabe

アップルのSiri、アマゾンのAlexa、グーグルのAssistantは、人の声によって制御できるようになっている。だが、この3つのAIアシスタントはどれも人間の耳が検知できない類の隠れたコマンドに敏感であることが、中国と米国の研究者によって明らかになった。

10日付のニューヨークタイムズの記事は、ラジオの音楽やYouTubeの動画、さらにスピーカー越しのホワイトノイズなどにも含まれる超低周波のコマンドによって、AIアシスタントが制御される可能性があり、ユーザーにとって大きなセキュリティリスクになる可能性があることを報道した。

この記事によると、人間がテキストの読み上げや音楽の録音といったまったく異なる内容を知覚している際に、AIアシスタントに電話をかける、ウェブサイトを立ち上げる、購入をする、ドアロックなどのスマートホームアクセサリーにアクセスできるといった動作をさせることができるという。7.6メートル離れたビルの開いた窓からコマンドを送って、AIアシスタントに写真の撮影やテキストメッセージの送信を指示することもできたという。

バークリーの研究者は、オーディオファイルを少し変えて、「会話認識システムが聴きとるはずのサウンドを遮断して、人間の耳がほとんど知覚できない形でマシーンによって書き換えられたサウンドに置き換える」ことが可能だった述べた。プリンストン大学と中国の浙江大学の研究者たちはさらに、AIデバイスを最初にミュートにして、それ自身の反応もユーザーに聴こえないようにして同様の試みをした。

新しいのは、秘密のコマンドが聴き取れないという特性を有する点だ。テレビ番組やコマーシャルは言語化されたフレーズによって特定のデジタルアシスタントをオープンかつ故意に作動させていたが、そのフレーズを隠すことは音声版サブリミナル広告のようなものだ。

現時点ではAIデバイスを隠れたフレーズで作動させることを規制する法律は存在しないが、法律上の直接的な対応がなければ、そうした行為が悪用される可能性もある。

このセキュリティの問題がまだ十分に解決しなければーー今後解決することはほぼ間違いないもののーー不正利用の件数が大きな数になる可能性もある。

この3つのデジタルアシスタントについては、どのメーカーもこの点の脆弱性については既に気づいているものの、既存の緩い状態についてはっきり説明していない。

アマゾンは、Echoの安全性を確実なものにするべく対策を取ったといっており、グーグルは検知不可能なコマンドの力を弱める機能がAssistantにあるといった。アップルは、特定のコマンドを不可にする制限と予防措置があるといっている。

超低周波音のフィルタリングだけでこの問題が解決できるかどうかは明らかではないが、シンプルなソフトウェア修正プログラムでこのリスクを除去できる可能性は多いにある。

【via VentureBeat】 @VentureBeat
【原文】

AppleのHomePodへの痛烈なレビュー後、Siri部門の求人が激増中

SHARE:

Appleのデジタルアシスタント HomePod の性能の悪さに対する痛烈な批判が起きたあと、Appleは最近 Siri の部署の採用を強化したことをデータ分析サイトの Thinknumが発見した。 Siriに特化した採用は、現時点で「最高記録」であると言われており、現在161のポジションが掲載されているという。この数は先月に比べて24パーセント高いものだ。 HomePodに対するレビューで声によ…

Appleのデジタルアシスタント HomePod の性能の悪さに対する痛烈な批判が起きたあと、Appleは最近 Siri の部署の採用を強化したことをデータ分析サイトの Thinknumが発見した。

Siriに特化した採用は、現時点で「最高記録」であると言われており、現在161のポジションが掲載されているという。この数は先月に比べて24パーセント高いものだ。

HomePodに対するレビューで声によるリクエストの処理能力のひどさが指摘された直後の2月中旬以降、AppleはSiriのエンジニアとマネージャーを新たに採用する努力を加速しているようだ。何十というポジションが2月に投稿されたが、その多くはまだオープンな状態であり、ここ最近の2日間でも20近くのSiri関連の仕事が投稿されている。

Thinknumのジョシュア・フルリンガー氏はこうコメントする。

「Siriをスマートにしようという、Appleの確固たる姿勢であることは間違いないでしょう。少なくとも、これまでよりもスマートにしよう、という考えです」。

AmazonのAlexaやGoogleのAssistant、MicrosoftのCortanaに比べると後発とみなされていることは「公然」であるというフルリンガー氏はいう。HomePodは、自宅のオートメーションタスクに対応する上で苦戦してきた。「私たちの採用データから見れば、Appleはどこを改善するべきかを理解しているのは明らかです」

Appleの求人ページには、Siri部門だけでも100以上のオープンポジションが掲載されている。AIエンジニアから、Siri関連のその他のポジションまで様々だ。ほとんどはApple Parkキャンパスでのポジションだが、他国の駐在ポジションも少数ながら含まれている。

【via VentureBeat】 @VentureBeat
【原文】

人々はなぜ音声アシスタントSiriを普段使いしないのか【調査結果】

SHARE:

<ピックアップ> Voice Assistant Anyone? Yes please, but not in public! ここ数年でぐっと使えるようになった未来機能のひとつに音声入力アシスタントがあります。 AppleのSiri、MicrosoftのCortana、OK Google、最近ではAmazonのAlexaが今後の重要な収益源になる可能性があるという話題もあり、人工知能…

File_000
Image Credit : Screenshot

<ピックアップ> Voice Assistant Anyone? Yes please, but not in public!

ここ数年でぐっと使えるようになった未来機能のひとつに音声入力アシスタントがあります。

AppleのSiri、MicrosoftのCortana、OK Google、最近ではAmazonのAlexaが今後の重要な収益源になる可能性があるという話題もあり、人工知能エージェントとしての役割はチャットボットの盛り上がりもあって改めて注目度が高まっています。

一方でこれを頻繁に使っているかというと、やや疑問符が付く人もいるかもしれません。私も個人的にはあまり使っていませんでした。どうしてなのでしょうか?

Creative Strategiesというマーケットリサーチ企業が発表した6月のレポートに興味深いものがありました。これによれば、やはり誰もが普段使いするには少しハードルがあるようです。

  • iPhoneユーザーの7割はSiriをたまに、もしくは滅多に使わない
  • iPhoneユーザーでSiriを使ったことがない人は2%
  • Androidユーザーの約6割がOK Googleをたまに使う
  • AndroidユーザーでOK Googleを使ったことがない人は4%

全般的に試しに使ってみたけど使わなくなった、というのがざっくりとした結果ですかね。で、肝心の理由ですが、「絶対に使わない」と言った人の20%は公共の場所でガジェットに向かって話しかけたくない、というのを理由に挙げているそうです。

またレポートによれば、この音声アシスタントを使うのは家や車で、特にハンズフリーが義務付けられている状況ではこういった入力方法は重宝されている様子も言及されてました。

当たり前と言えば当たり前の結果なのですが、逆に言えば、音声入力は場所によっては使える入力方法になっており、TPOに合わせた端末を開発することでビジネスチャンスは広がる可能性があるとも言えるわけです。

家と車以外にどこかニッチがあるか探してみるのも楽しいかもしれません。

Amazonのジェフ・ベゾス氏はこういった人工知能エージェントについて「平均的な世帯は3台使うようになる」と先日のカンファレンスで語っていましたし、なるほど、利用目的もそうですが、場所によっても違ったアシスタントの必要性が出てくるのかもしれませんね。

via Creative Strategies

 

中国で音声関連のアプリがブレークするか?

SHARE:

【原文】 AppleのSiriが人との会話においてその能力を発揮し、人々の問題を解決に導いてきてから、アプリ市場ではこのトレンドに乗ろうとするクローンが増えてきている。(実際の所Siriは、その主人から投げかけられる、つまらなく時に馬鹿げた冗談に耳を傾けるのに飽きていたことだろう。) 例えばアメリカのGoogle Now、Baidu(百度)/Sogou(捜狗)/360音声アシスタント(智能360語…

【原文】

Siri-vs.-Google-Now-Search1

AppleのSiriが人との会話においてその能力を発揮し、人々の問題を解決に導いてきてから、アプリ市場ではこのトレンドに乗ろうとするクローンが増えてきている。(実際の所Siriは、その主人から投げかけられる、つまらなく時に馬鹿げた冗談に耳を傾けるのに飽きていたことだろう。)

例えばアメリカのGoogle Now、Baidu(百度)/Sogou(捜狗)/360音声アシスタント(智能360語音助手)や昨年私たちが取り上げたiFly Yudian(訊飛語点)がある。

これらのアプリの仕様は基本的にはSiriと同様である。スマートフォンに搭載された同様の音声アシスタントアプリに話しかけ、スマートフォンにオンラインで検索、天気予報の通知、誰かと通話やメール、近くのレストランの検索などを指示することができる。

中国におけるSiri系のサービスのブレークは音声アプリの発展の第一段階であるとするならば、私たちは多様な目的に適応した音声関連のアプリが台頭する発展の第二段階はまだ目撃していないことになる。

例えば、カラオケアプリである「Changba(唱吧)」はApp Storeでローンチすると一晩で成功をおさめた。音声に基づいたInstagramであるPapaもスマートフォンユーザの心をとらえた。これら二つのアプリは新しいアプリが台頭することが無いと思われた所、2012年の輝く星となった。

これらのアプリの他にも、人の音声とスマートフォンのマイクロフォンの力を最大限に生かした面白いアイディアが実現されようとしているが、この分野の将来にどれだけ期待がもてるだろうか。新参者は盛り上がりを感じて、このビジネスのサステナビリティ(持続可能性)を考慮せずに飛び込んでいるのか。何故正しく実行するより、早く実行することに集中するのか。

音声アプリがどこに向かい、どのようにお金を得られるようになるか、そして新しいユーザの獲得とモバイルのコミュニティを引きつける勢いを保ち続けることができるのかは未だ定かではない。

Papa(啪啪)のような音声アプリは娯楽アプリと位置づけられ、似たような機能と運営モデルを持っている。乱立している中では均質化は避けられないのは明白である。ベンチャーキャピタリストもこの盛り上がりに対して懸念を示している。彼らも音声関連のアプリが必須のソーシャルアプリに成りうるだけの魅力があるのか分からないからだ。

Papaに投資を行ったDiandian(点点)のファウンダーでCEOのJack Xuも音声アプリの利用状況がとても限定されていることが、このようなサービスが広まるための障壁になるということを認めている。

【via Technode】 @technodechina

AppleのSiriを追いかける中国の検索エンジン大手2社が独自の音声入力アシスタント機能をローンチ

SHARE:

【原文】 AppleのSiriやGoogle Nowのようなモバイル音声アシスタントがあれば、サーチエンジンのホームページに入って言葉を入力するといった面倒なことはしなくてよい。 中国のサーチエンジンBaidu(百度、NASDAQ:BIDU)とSogou(搜狗)の両社は、この新たなテクノロジーに後れを取るまいと、今月Siriに似た独自の音声入力アシスタントをローンチした。 Baidu Voice …

【原文】

Chinese-voice-assistant-appsAppleのSiriやGoogle Nowのようなモバイル音声アシスタントがあれば、サーチエンジンのホームページに入って言葉を入力するといった面倒なことはしなくてよい。

中国のサーチエンジンBaidu(百度、NASDAQ:BIDU)とSogou(搜狗)の両社は、この新たなテクノロジーに後れを取るまいと、今月Siriに似た独自の音声入力アシスタントをローンチした。

Baidu Voice Assistant(百度語音助手)とSogou Voice Assistant(搜狗語音助手)は共にAndroid用のみで、スマートフォンで自然に会話を交わすように質問や話ができる。そしてこれらのアプリは天気から歌まであらゆる検索を提供し、計算や友人の電話番号などにも素早く回答することができる。

Baidu Voice AssistantはSohu(捜狐、NASDAQ:SOHU)が運営する新アプリであるSogouローンチの数週間後の昨日、ローンチした。Baiduは中国ではトップのサーチエンジン、一方Sogouは市場に占める割合は7.83%とBaiduほど大きくないが中国第3位のサーチエンジンだ。

UIに関しては、両アプリはAppleのSiriよりもGoogle Nowに近く、探している情報がカード状にまとめられて画面に表示される。音声アシスタントに「北京の天気」と話しかけると次のような画面が表示される。左がBaidu、右がSogouだ。

Sogou-Baidu-Voice-Assistant-apps-02-680x592

次に、「Jay Chou(訳注:台湾の歌手、周杰倫)の曲」と言うと、両アプリともに自社の音楽ストリーミングサービスに接続されたミニプレイヤーを表示する。こちらも、左がBaiduだ。

Sogou-Baidu-Voice-Assistant-apps-01-680x592

もっと軽い話題では、両社の新アプリは求められれば冗談も言ってくれる。

中国語の音声入力アシスタントの分野での競合には、これを専門に扱うiFlyTek(安徽科大訊飛)がある。China Mobile(中国移動)は最近、同社の株式を15%取得している

これらのアプリはGoogle Playでチェックすることができる。こちらはBaiduのリンクで、こちらはSogouだ。

【viaTech in Asia】 @TechinAsia

中国の大手検索企業のBaidu(百度)が、Siri風サービスのローンチへ

SHARE:

【翻訳 by Conyac】 【原文】 Baiduモバイル・クラウドコンピューティング部門の副ジェネラルマネージャーYue Guofeng(岳国峰)氏は最近のイベントで、中国検索大手のBaiduがまもなく、おそらく今月、Siri風のパーソナルアシスタントをローンチすると発表した。 音声認識はBaiduにとって大きな問題ではないとYue氏は述べている。Baiduは音声認識に以前から取り組んでおり、B…

【翻訳 by Conyac】 【原文】

Baiduモバイル・クラウドコンピューティング部門の副ジェネラルマネージャーYue Guofeng(岳国峰)氏は最近のイベントで、中国検索大手のBaiduがまもなく、おそらく今月、Siri風のパーソナルアシスタントをローンチすると発表した。

音声認識はBaiduにとって大きな問題ではないとYue氏は述べている。Baiduは音声認識に以前から取り組んでおり、Baiduのモバイル検索にその機能を加えようと考えていたからだ。

「音声とビジュアルは最も自然な2つのインタラクションです。顔の認識機能はBaidu Albumに導入されていますし、将来はARなどの技術も含め、さらにこうした方面に取り組んでいきたいと思います」。

中国企業のiFlytekは今年すでに同様のサービス「iFlytek Yudian(訊飛語点)」を提供している。同社の音声認識の正確さは、標準中国語に関しては90%以上だ。正確さ以外には、身近にいる個人アシスタントのようにその他多くの雑用もしてくれる。例えば、携帯電話に「ベンに『明日の8時に夕食をたべよう』とメッセージを送ってくれ」と言えば、音声を文章にして送信する前に確認をしてくれる。

Yue氏は、BaiduのSiri機能の詳細については明らかにしなかった。

【via Technode】 @technodechina