BRIDGE

Kyle Wiggers

Kyle Wiggers

テクノロジージャーナリスト。VentureBeat では主に AI の話題を担当。

執筆記事

Amazon Alexa、より自然な口調でテキストを読み上げられるように

SHARE:

Amazonは4月16日、サードパーティが提供するAlexaスキル(音声アプリなど)のニュースや音楽コンテンツ向けに、長文用の口調スタイルを発表した。ウェブページや記事、ポッドキャスト、ゲームのストーリーなどといった多様なテキスト情報に対応しており、米国の開発者は今週(4月第3週)から利用開始できる。 テキストをより自然に読み上げ、ユーザのエンゲージメントを上げることで体験の向上が見込まれる。加え…

Amazon Echo Dot Clock
Image Credit: Khari Johnson / VentureBeat

Amazonは4月16日、サードパーティが提供するAlexaスキル(音声アプリなど)のニュースや音楽コンテンツ向けに、長文用の口調スタイルを発表した。ウェブページや記事、ポッドキャスト、ゲームのストーリーなどといった多様なテキスト情報に対応しており、米国の開発者は今週(4月第3週)から利用開始できる。

テキストをより自然に読み上げ、ユーザのエンゲージメントを上げることで体験の向上が見込まれる。加えて、プロの声優を雇う必要がないので開発者にとってはコスト削減になり、スタジオでレコーディングするよりも時間の節約になる。

Amazonによると、この長文用の口調スタイルは、AIによるテキスト読み上げモデルを採用しており、段落と段落、セリフとセリフのあいだに自然な間が組み込まれている。同様に、Googleアシスタントにも最近、webサイトやAndroidアプリ内でより自然で人間らしい音声で長文コンテンツを読み上げる機能がローンチされた。

聞いてみてほしい。(編集部注:音声データは原文サイトをご確認ください)

【音声1】

こちらがAlexaのデフォルトスタイルだ。

【音声2】

長文用の口調スタイル以外にも、開発者はAmazon Pollyのニュース読み上げ・会話スタイルを利用することができる。Amazon PollyはAmazonのクラウドサービスの1つで、テキストを生き生きとした音声に変換するサービスだ。Alexaスキルの言語は29カ国語に対応しており、声質はMatthew、Joanna、Lupeから選ぶことができる。ニューススタイルはまるでテレビのアナウンサーやラジオのパーソナリティが話しているかのように聞こえる。会話スタイルの場合は堅苦しさがなく、あたかも友達や家族と話しているかのようだ。

昨年、AmazonはAIによって生成された音声に関する詳細な研究論文を発表した。声優が身に付けるには数十時間はかかるであろう口調スタイルを、わずか数時間のトレーニングで習得することができるシステムについて述べている。同社のモデルは、一連の音素をスペクトログラムに変換する生成系ニューラルネットワークからなり、時間軸に沿って変化する音声周波数のスペクトラムを視覚的に表現する。そうしたスペクトログラムを連続的なオーディオ信号に変換するボコーダもついている。

ひいては、AIモデルによって、大量のニュートラルな話し方の音声データと特定の話し方による数時間程度の音声データを結びつけるトレーニング方法を生み出し、口調スタイルとは無関係な要素と固有な要素の両方を識別できるAIシステムを開発している。Amazonはこれを利用してAlexa用の新ボイスやAmazon Pollyで多言語に渡る開発者向けボイスを制作している。

最後に、Amazonによると、Alexa用音声アプリの開発者は、アメリカ英語、アメリカスペイン語、カナダフランス語、ブラジルポルトガル語など、6つの言語による10種類の音声をAmazon Pollyから追加で使用することができる。

これらの開発に先立ち、AmazonはAlexaスキル用の口調として「うれしい・わくわくする」、「がっかり・同情」、短めのニューススタイル、音楽スタイルをリリース。11月にはブログで、感情をもたせた音声によってAlexaの標準音声よりも顧客満足度が30%上昇し、ニューススタイルおよび音楽スタイルについては自然度がそれぞれ31%、84%上昇したとしている。

Amazonは最近、AIを駆使して特注の話者を生成するAmazon Pollyの機能、「Brand Voices」もローンチした。このサービスでは顧客と社内エンジニアが協同して特定のペルソナを表す音声をAIで作り上げる。たとえばカナダのKFCには南米なまりの口調、ナショナルオーストラリア銀行にはオーストラリア英語といった具合だ。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

GoogleのPixel4、AIで人の顔を3D化できるように

SHARE:

Googleは10日、Pixel4またPixel4 XLにビルトインされるuDepthを利用した、リアルタイム・ポイントクラウドを可視化するデモアプリをリリースした。同技術は機械学習を利用し、なりすましによる悪用を防ぐことができるとする。背景のぼかしや、ポートレート機能、3D写真など数多くの機能を持つ。 uDepthはPixel4シリーズにのみ配信されることが想定される。しかし、同技術はロボット工…

pjimage-1.jpg
Screenshots captured from Google’s new uDepth visualizer for the Pixel 4.
Image Credit: Google

Googleは10日、Pixel4またPixel4 XLにビルトインされるuDepthを利用した、リアルタイム・ポイントクラウドを可視化するデモアプリをリリースした。同技術は機械学習を利用し、なりすましによる悪用を防ぐことができるとする。背景のぼかしや、ポートレート機能、3D写真など数多くの機能を持つ。

uDepthはPixel4シリーズにのみ配信されることが想定される。しかし、同技術はロボット工学など、正確な深度センシングが求められるエリアにて応用されることが予期できる。また、コンピュータービジョンへの応用、ロボットによるプロセスオートメーション等に応用されることも期待できるだろう。

Google Pixel 4 uDepth
uDepthを基に生成されたビジュアルデータ

uDepthはつい先日にAPIとして公開され、Pixel4のカメラアプリにあるSocial Media Depth設定の項目から利用可能だ。同技術は赤外線パターンプロジェクター、また同デバイス専用のニューラルチップ(Pixel Neural Core)を利用している。奥行きを保ったフレーム生成のため、1つ目のカメラで画像における周辺領域をキャプチャーし、2つ目のカメラで共通領域を探し出す。これらにより検出されたデータに対し赤外線パターンを投影することで、各領域を識別しやすくする仕組みとなる。

領域識別の際、uDepthは相互に重なり合っていない画像タイルを比較し、それぞれの深層度を比較している。(機械学習を利用し、明るさと隣接情報をモデリングすることで、1.5ミリ秒/フレーム以下で修正を実施する)。

またuDepthではカラー画像、人物識別、深度を組み合わせたAIモデルを活用し、3Dにおける深度マップを推定する。Googleによれば、同モデル作成に際しては、高解像度の配列カメラ、331個のLED照明、高解像度深度センサーを備えた設備を用意し学習を繰り返したという。

Google Pixel 4 uDepth

uDepthソフトウェアリードのMichael Schoenberg氏・GoogleリサーチのAdaesh Kowdle氏は同社ブログにて以下のように述べている。

「深度センシングと呼ぶ、3D情報の測定を実施する技術は開発者・ユーザーどちらにも有益で貴重なツールです。しかし、典型的なRGBベースの技術では計算コストが高く、テクスチャーの低い環境や、明かりが少ない環境ではではうまく動作しない可能性がありました。Pixelでは、高速かつ暗闇での動作が求められていたため、今回のようなアプローチが望ましいという結論に至りました」。

※本稿は提携するVentureBeatの記事の抄訳

【via Venture Beat】

【原文】

----------[AD]----------

MicrosoftのAIは、ビデオクリップの字幕が真実かどうかを判断しようとしている

SHARE:

※本記事は提携するVentureBeat「Microsoft’s AI determines whether statements about video clips are true」の抄訳になります。 プレプリントサーバーArxiv.orgに公開された論文の中で、カーネギーメロン大学、カリフォルニア大学サンタバーバラ校、マイクロソフトのDynamics 365 AIリサーチの研究者たちは、動画…

microsoft-1-e1580261336710.jpg
Microsoft
Image Credit: Khari Johnson / VentureBeat

※本記事は提携するVentureBeat「Microsoft’s AI determines whether statements about video clips are true」の抄訳になります。

プレプリントサーバーArxiv.orgに公開された論文の中で、カーネギーメロン大学、カリフォルニア大学サンタバーバラ校、マイクロソフトのDynamics 365 AIリサーチの研究者たちは、動画と言語の推論について説明している。

これはAIがビデオクリップに含む字幕をもとに、内容が合っているか矛盾しているかを推論するものだ。動画と言語の理解に関する調査をさらに進め、企業で使用される会議用の自動テープ起こしツールを強化することを目的としている。

研究者たちが説明するように、動画と言語の推論には、ビジュアルとテキストの両方の手がかりを徹底的に解釈する必要がある。 そのため研究者らは、 Amazon Mechanical Turkを介したクラウドソーシングワーカーが、字幕付き動画を視聴して作成したステートメントを、現実のシーンでの発言と組み合わせたビデオデータセットとして紹介している。

ワーカーたちは、動画と字幕の両方を理解した上で、動画の中の明らかな情報(オブジェクト、場所、キャラクター、社会活動など)を記述し、さらに複雑なプロット(各出来事の理解、人間の感情や関係性の解釈、出来事の因果関係の推論)への理解度を明らかにするためのステートメントを書いた。

081c9a32-1f1f-47dc-9020-38f07d18d134.png

このデータセットには、「フレンズ」、「デスパレートな妻たち – Desperate Housewives」、「 ママと恋に落ちるまで – How I Met Your Mother」、「モダン・ファミリー」などのYouTubeやテレビドラマシリーズから、合計582時間に及ぶ95,322組以上の動画ステートメントと15,887本の映画が含まれる。

それぞれ約30秒の動画は、ポジティブまたはネガティブな6つのステートメントとセットになっており、それは登場人物を特定したり、行動を認識したり、会話やその理由を推論をしたり、人間の動きについて言及したりしている(偏りを防ぐために、否定的なステートメントを収集する際には肯定的なステートメントを参照し、その一部だけを修正して否定的なものにするように依頼した)。

データセットをベンチマークするために、共同研究者らは、動画の特徴を数値化してエンコードできるよう、長期依存性を学習できるAIモデルの一種である双方向性長期短期記憶モデルを採用し、 別のモデルではステートメントと字幕をエンコードした。 動画、字幕、ステートメントが与えられると、データセットの80%による学習、10%による妥当性の確認、10%によるテストにより学習した別のモデルが、ステートメントが動画と字幕に合っているか矛盾するかを判断する。 人間が行った場合85.20%の精度なのに対して、最も性能の高いベースラインは59.45%の精度を達成したという。

「ベースラインモデルと人間の性能の差は大きい。このタスクにコミュニティにも参加してもらい、マルチモーダル推論の最先端を行くために、より強力なメソッドを発明していきたい。今後の可能性としては、キーフレームをローカライズするモデルの開発や、推論能力を向上させるために動画と字幕のアライメントを改善していくことなどが挙げられる」と研究者は述べている。

この研究は、Microsoft Research Asiaとハルビン工科大学による研究に続いており、コメント、ビデオ、オーディオの間の表現をキャプチャすることで、AIを使って動画のキャプションを生成しようとしている。システムのコードはGitHubで公開されており、候補セットから最も関連性の高いコメントと動画を照合し、クロスモーダル表現を共同で学習する。

【via VentureBeat】 @VentureBeat

【原文】

 

081c9a32-1f1f-47dc-9020-38f07d18d134.png

----------[AD]----------

感染拡大に力を発揮する自律走行車たち、検体輸送に医療従事者への食事配送まで

SHARE:

メイヨー・クリニックは今日(注:原文掲載日は現地時間4月2日)、Bestmile社およびJacksonville交通局(JTA)との提携を発表し、病院のドライブスルー検査場で収集した医療機器、およびCOVID-19検査結果を輸送するための、自律型シャトルを配備することを発表した。コロナウイルス感染拡大のリスクを軽減しつつ、必要とされる物資の配送を迅速化することが期待されている。 メイヨー・クリニッ…

39a7bd2d-bf68-4c4c-8485-c83d6c1b2033.png
Beep社が提供する自律走行バスのひとつ
Image Credit: Beep

メイヨー・クリニックは今日(注:原文掲載日は現地時間4月2日)、Bestmile社およびJacksonville交通局(JTA)との提携を発表し、病院のドライブスルー検査場で収集した医療機器、およびCOVID-19検査結果を輸送するための、自律型シャトルを配備することを発表した。コロナウイルス感染拡大のリスクを軽減しつつ、必要とされる物資の配送を迅速化することが期待されている。

メイヨー・クリニックはフロリダの院にて、3月30日からBeep社とNavya社の提供する4つの自律走行シャトルを使用し始めたそうだ。これは院の検査場から病院のキャンパス内にある処理研究所にCOVID-19検査を輸送するために使われている。なお、Beep社はオーランド郊外のNona湖から3台のシャトルを輸送しているのだが、これはJTAにて現在進行中の自律走行車プログラムで追加されたものだ。

COVID-19の試験サンプルは、メイヨー・クリニックのスタッフがシャトルに内容物を積み込む前に、安全なコンテナに保管されることになる。

このパートナーシップは規模は小さいが、世界的なトレンドに沿ったものとなる。COVID-19の影響を受けた地域に医薬品を届けるために、自律走行車が医療システムに利用されるようになっている。

中国では新興企業のNeolix(新石器)社が提供するバンが、COVID-19の影響を最も強く受けた地域に医療品を届け、人手不足を補っているそうだ。Baidu(百度)社の自律走行車プラットフォーム「Apollo」との連携により、これらのバンは北京で病気になった人々の看病をしている医療従事者に食料を届けるという仕事を担っている。

また3月中旬には、KiwiBot社の自律配送ロボットが、バークレーとデンバーのコミュニティに衛生用品やマスク、抗菌ジェル、衛生用品などの配送を開始している。

以前の本誌インタビューでTactile MobilityのCEO、Amit Nisenbaum氏は自律走行車の意義を「配達ロボットは命の危険を犯さず利便性と安全性を担保してくれる。しかも今、人々は自律走行車が【ソーシャルディスタンス】を保ち、感染の拡大防止に役立つことを理解している」と語っている。同社は自律走行車が道路の段差やカーブ、危険を検知できるようにする触覚データとセンシング技術を提供する企業だ。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

進むAI人材格差、企業によるAI導入は過去4年で270%増【ガートナー調べ】

SHARE:

ガートナーのレポートによれば、過去4年間にて、AI人材に対し最も需要が集まったのはIT部門でなく他のビジネス部門であるらしい。同レポートによれば、IT部門による人材募集は他の部門に比べ半分以下であり、採用戦略とAI労働市場とのミスマッチが起きていることを示している。 2015年7月のデータによれば、IT部門によるAI人材募集はたったの1万4900件だったのに対し他の部門では計8万9895件と大幅に…

pexels-photo-2599244
Photo by Alex Knight on Pexels.com

ガートナーのレポートによれば、過去4年間にて、AI人材に対し最も需要が集まったのはIT部門でなく他のビジネス部門であるらしい。同レポートによれば、IT部門による人材募集は他の部門に比べ半分以下であり、採用戦略とAI労働市場とのミスマッチが起きていることを示している。

2015年7月のデータによれば、IT部門によるAI人材募集はたったの1万4900件だったのに対し他の部門では計8万9895件と大幅に上回っている。また、2019年3月には、IT部門による募集数は363%増の6万8959件となったが、同時に他部門においても74%増の15万6294件となっている。

AI人材を大量採用している部門には、マーケティング、セールス、カスタマーサービス、財務やR&Dに多く見られる。同部門での採用は、顧客モデリング、収益分析、セグメンテーション、需要計画、リスクマネジメントなどを前提に実施されているとされる。特に資産を中心とする業界では、AIのユースケースが高まっており予知保全、ワークフロー、最適化、品質管理等のプロジェクトにおける需要が高まっている。

AI人材格差は既に顕著となっている。

International Data Corporation(IDC)の調査によれば、既にAI事業に取り組んでいる事業者の内25%がコスト超過、候補者不足、データの偏り、スキル不足により包括的なAI戦略を組み込めていない状態にあるという。また、2017年12月に公開されたTencent Research Instituteが公開した報告書によれば、現状世界には30万人のAI研究者がいるが、企業の需要は数百万に達しているという。

ガートナーは2019年1月、企業によるAI導入は過去4年で270%と驚異的スピードで増加し、過去1年だけでも37%増加したと報告している。同数値は2015年の10%から明らかな増加傾向にあり、背景にはエンタープライズAI市場が2022年までに61.4億ドルまで成長する予想が立てられていることにあるとされる。McKinsey Global Instituteによれば、AIによる労働市場の変化により今後10年の国内総生産(GDP)成長率は1.2%増加し、今後12年間における経済的純利益は20〜25%成長すると予想されている(13兆ドル)。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

IBM主催の開発者イベント、COVID-19対策テーマが追加

SHARE:

  本稿は提携するVentureBeatの記事「IBM adds coronavirus to 2020 Call for Code Global Challenge」の抄訳になります IBMは例年開催する開発者向けイベント「2020 Call for Code Global Challenge」において、世界的課題となっているCOVID-19へのソリューションを追加テーマとすることを発…

 

Capture
Image Credit: IBM

本稿は提携するVentureBeatの記事「IBM adds coronavirus to 2020 Call for Code Global Challenge」の抄訳になります

IBMは例年開催する開発者向けイベント「2020 Call for Code Global Challenge」において、世界的課題となっているCOVID-19へのソリューションを追加テーマとすることを発表した。来週中には、同領域おけるアプリケーション制作における概要を3つに分け発表するとしている。具体的には今回のような緊急時におけるコミュニケーション方法、リモート環境における学習手段、ローカルコミュニティーを元気づける手段が組み込まれるとされる。

同イベントへは本日(編集部注:原文掲載日は現地時間3月20日)より参加登録可能。Red Hat OpenShift、IBM Cloud、IBM Watson、 IBM Blockchain、またThe Weather Companyにおけるデータを活用したオープンソースアプリケーションの制作に取り掛かる。優勝者にはキャッシュで20万ドルが贈られる。

IBMでは、世界でも有数の専門家と協力関係を築き、差し迫るニーズを把握したうえで最適なリソース提供を実施しています。最新テクノロジーを活用し、持続的に世界の人々へ影響を与える手段を得ていると認識しています。こういった時期にも関わらず、私たちの呼びかけに応じてくださったことへ大きく感謝いたします。

既に発表されていたように、今年のCall for Code Global Challengeでは主に気候変動とその影響に対するソリューション提示も一つの目的となっている。Red Hat、JP Morgan Chase、 Persistent Systems、Unity Technologies、NearForm、またJohnson & Johnsonによってスターターキットが開発されていた。人々が地域社会にて直面する、エネルギーの持続可能性や災害からの回復など、個々の問題へ焦点があてられることが想定されていた。

IBMによれば、参加者はあらゆる面でパートナー・プロバイダーの支援を受けることが出来ると述べている。その一例として、HEREロケーションAPIでは、開発者が地理空間データ、ルーティング、高度、対話型マップへのアクセス権限が付与される。

キットに含まれるトピックは、国連の持続可能な開発目標や仙台防災枠組みにて取り決められた私たち現実世界が求めるニーズに基づいています。今、私たちは健康、地球環境、そして私たちの生存そのものを脅かす緊急の危機に直面しています。私たちは、開発者、データサイエンティストなどあらゆる分野の関係者が呼びかけに応じてくれることを期待しています。

同社が2018年に開催した第一回Call for Code Global Challengeでは、プエルトリコに直撃したハリケーン・マリアにおける災害被害の解消を目的とした太陽光発電のメッシュネットワークデバイスの設計に成功した。昨年には、消防士に特化した健康管理プラットフォームの開発者が優勝を収めている。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

年成長率75%超、機械学習を活用した中小事業者向けローン「Lendio」

SHARE:

※本記事は提携するVentureBeat「Lendio raises $55 million to surface small business loans using machine learning」の抄訳になります。 機械学習を活用し、借り手と貸し手を適切にマッチングするプラットフォームを運営する「Lendio」が5,500万ドルの調達を発表。同社CEOのBrock Blake氏は、同調達資…

ezgif-1-ba0b8f75787b-e1582667221886
Image Credit : Lendio

※本記事は提携するVentureBeat「Lendio raises $55 million to surface small business loans using machine learning」の抄訳になります。

機械学習を活用し、借り手と貸し手を適切にマッチングするプラットフォームを運営する「Lendio」が5,500万ドルの調達を発表。同社CEOのBrock Blake氏は、同調達資金は貸し手向けの新機能の追加などに費やされ、同プラットフォームの拡大に寄与すると発言している。

Lendioの機械学習アルゴリズムは、貸し手比較・信用スコアや担保、手数料の算出を行うことで、中小事業者による担保ローン獲得を補助し、全体のプロセスを最適化すると主張する。

事業者は同社ウェブサイト上にて、15分程度で済むアプリケーション・フォームに企業の情報を記入する。すると短期・長期か、クレジットカードかキャッシュか、他にはスタートアップ・ローンか商業モーゲージかなど、複数のオプションから最適なプランを選ぶことが可能。貸し手には American ExpressやChase、PayPal、LendingClub、Kabbage、 Comcast Business、Staples, and Funding Circleなどが名を連ねる。

lendio3
Image Credit : Lendio

Lendioは過去2年間で10万件のローンを提供してきた実績を持ち、その合計額は20億ドルに及ぶという。また年間成長率は75%を超えている。

Brock氏は、本調達資金は、資金管理ダッシュボードという新プロダクトの開発資金にも当てられると発言している。これは顧客が自身のキャッシュフローや調達履歴を簡単に閲覧することや、請求書のカスタマイズ、銀行口座とクレジットカードの接続、バランスシートの作成、税計算など可能にする新機能。事業者は会計や請求業務を簡易化でき、またLendioも多くのデータを収集することができる点で大きく期待されている。

また同社は貸し手事業者の性質に合わせ、オリジナルのオンライン・アプリを提供することも検討している。銀行や信用ユニオン、オンライン貸し付け業者など別にカスタマイズされたアプリケーションを提供し、各貸し手は、そのアプリを用いて融資の意思決定が行えるようになる。

今回の5,500万ドルの調達資金のうち、それぞれ3,100万ドルは株式、残り2,400万ドルはデットによるもの。本調達を機に同社の累計調達額は1億ドルに到達している。またLinkedInのデータによれば、同社の従業員は300名規模であるという。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

AIで貨物スペースのムダをなくせーー配送マッチングの「Flock Freight」が大型調達

SHARE:

※本記事は提携するVentureBeat「Flock Freight raises $50 million to match shippers with freight transportation」の抄訳になります。 世界の輸送業界における大型トラックの重要性は言うまでもない。2017年の米国市場において、カナダ・メキシコ間を渡った6,140億ドル分の貨物のうち、60.2%以上が大型トラックによ…

Image Credit: Flock Freight

※本記事は提携するVentureBeat「Flock Freight raises $50 million to match shippers with freight transportation」の抄訳になります。

世界の輸送業界における大型トラックの重要性は言うまでもない。2017年の米国市場において、カナダ・メキシコ間を渡った6,140億ドル分の貨物のうち、60.2%以上が大型トラックによって輸送されている。一方で、過去3年間で7,000億ドルの価値を生む同市場の大半を占有する大手輸送業者の影で、小型貨物かつ短距離な輸送を手がける中小配送事業者らが、事業維持に大きく苦戦しているという事実は、あまり知られていない。

しかし、Flock Freightが構築する機械学習を活用したマーケットプレイスは、同問題を解決する。AIを元にした最速・最適ルートの発見と、貨物スペースの余剰を埋める配送マッチング・システムの導入により、配送は無駄なく効率的に行われる。投資家にはGoogle Venturesの名もあり、業界外からも大きく注目されていることが分かる。

Screen-Shot-2019-07-12-at-3.30.48-PM
Image Credit : Venture Beat

そんなFlock Freightは本日、シリーズBラウンドで5,000万ドルの調達を発表した。前回シリーズAラウンドの1,800万ドル、前々回シードラウンドの250万ドルと合算すると、本調達により同社の累計調達額は7,000万ドルに到達した。

同社CEOの Zaslansky氏によれば、本資金は同マーケット・プレイスの拡大に投下される見込みだという。また同氏は、Flock Freightのビジネスは各地に配送物用の倉庫を設置する必要のない新しい配送サービス・モデルであり、配送車及び依頼者のコスト削減に大きく貢献できるという点を強調している。

同マーケット・プレイスのトラック・ネットワークは米国及びカナダ内で数千台と広がっており、全てのトラックの位置情報などはリアルタイムでトラッキングされている。同社によれば、損傷クレームは0.001%未満で、かつ定刻配送の達成率は97.5%と非常に高水準であるという。またトラックの変更や倉庫でのストップなど無駄な工程を省くことで、燃料の排出を従来の40%以上抑えることに成功しているとのこと。

なお業界の競合としては、先日2億ドルの予算が投じられた「Uber Freight」、1億4,900万ドルの調達を実施したサンフランシスコの「KeepTrucking」、9,700万ドルの調達をした「Next Tucking」、そして27.5億ドルの評価額をつけて4億ドルの調達に成功した「Convoy」などが存在している。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

AmazonのAIは言葉を理解してファッション画像を作ることができる

SHARE:

敵対性生成ネットワーク(GANs:サンプルを生成するジェネレーターと、生成されたサンプルと現実世界のサンプルの区別を試みる弁別装置の2部で構成されるAIモデル)は、ビデオ、アートワーク、音楽合成から、創薬や誤解を招くメディアの検出まで、幅広いタスクに適用されている。 今朝のブログ投稿で明らかにしたように、Amazonはこの方法をeコマースにも適用させるようだ。Amazonの研究者たちは、製品の説明…

pexels-photo-2041397
Photo by CoWomen on Pexels.com

敵対性生成ネットワーク(GANs:サンプルを生成するジェネレーターと、生成されたサンプルと現実世界のサンプルの区別を試みる弁別装置の2部で構成されるAIモデル)は、ビデオ、アートワーク、音楽合成から、創薬や誤解を招くメディアの検出まで、幅広いタスクに適用されている。

今朝のブログ投稿で明らかにしたように、Amazonはこの方法をeコマースにも適用させるようだ。Amazonの研究者たちは、製品の説明にあった衣服の例を生成するGANについて解説し、これらがユーザーの検索クエリを絞り込むために活用できるとも述べた。

たとえば買い物客が「女性用の黒いパンツ」を検索し、「プチ(小さなサイズの)」という単語を追加してから「カプリ(細身でぴったりとしたカプリパンツのこと)」という単語を追加すると、画面上の画像は新しい単語ごとに調整される、といった具合だ。

スタートアップのVue.aiが商品化した、衣服の特性を排除し、リアルなポーズや肌の色、その他の特徴を生成することを学習したGANモデルとそう違わない。アパレルのスナップショットから、あらゆるサイズのモデルイメージを従来の写真撮影の最大5倍の速度で生成できる。

Amazonが提案するシステム(ReStGAN)は、既存のシステム(StackGAN)を修正したもので、画像を2つの部分に分割することで新たな画像を生成する。

GANを使用してまず直接テキストから低解像度の画像を生成し、その後GANで質感や自然な色合いを載せた高解像度バージョンにアップサンプリングする。GANsは一連の入力を順番に処理する、長い短期メモリのAIモデルでトレーニングされ、続けて検索窓に単語が追加されると、画像が切り替わる。

また、商品説明から合成する作業を簡単にするために、システムは3つの製品クラス(パンツ、ジーンズ、ショートパンツ)に制限されている。これはトレーニング画像を標準化するためだ(つまり、形状とスケールが合うように、画像の背景は切り取られ、切り取られてリサイズされている)。

download

研究チームはこのシステムを監視なしでトレーニングした。これはすなわち、人間による割り当て業務を必要としない製品タイトルと画像でトレーニングデータが構成されたということにほかならない。

同チームは、モデルによって生成された画像を、アパレルタイプ(パンツ、ジーンズ、ショートパンツ)、色、およびメンズ/レディース/ユニセックスのどれに分類するかの3つの条件で識別する補助分類を使用して、システムの安定性を高めた。

研究者はまた、LABと呼ばれる表現空間で色をグループ化した。これは、ポイント間の距離が知覚される色の違いに対応するように設計されており、視覚的に類似した色をテキスト説明の同機能にマッピングするルックアップテーブルの基礎を形成した。

研究者によると、古い視覚的特徴を保ちながら新しいものを追加する機能は、このシステムの新規性のひとつであり、もうひとつは、入力したテキストの色によりマッチする色の画像を生成するカラーモデルだ。実験により、ReStGANはStackGANの構造に基づく従来モデルの最高パフォーマンスと比較して、タイプによる製品分類を最大22%、性別によるものを最大27%改善したと研究チームが報告した。 色みに関しては100%向上した。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

米AmazonのカスタマーサポートはAIにおまかせ、新たな試験プログラムを開始

SHARE:

米Amazonは、AIをベースとしたカスタマーサポートのパイロットプログラムを開始したと同社ブログにて発表した。パイロットプログラムは2つのテーマで実施される。 1つは完全に人を介することなく機械学習を活用し、直接的に顧客の要望に対応することを想定したもの。対して2つ目は、人間の既存エージェントの効率性をあげることに焦点を置いたものとなっている。 同社にて応用科学マネージャーを務めるJared K…

pexels-photo-230554
Photo by Roman Pohorecki on Pexels.com

米Amazonは、AIをベースとしたカスタマーサポートのパイロットプログラムを開始したと同社ブログにて発表した。パイロットプログラムは2つのテーマで実施される。

1つは完全に人を介することなく機械学習を活用し、直接的に顧客の要望に対応することを想定したもの。対して2つ目は、人間の既存エージェントの効率性をあげることに焦点を置いたものとなっている。

同社にて応用科学マネージャーを務めるJared Kramer氏はブログにて、自動カスタマーロボットに機械学習が導入され、顧客ごとに最適な情報をチャットボットのみで完遂させることを目指すとしている。自身のみで実行できないという判断基準も設けられており、その場合は最終的に人間のカスタマーサポートへと繋げるフローも確立している。

これらは今まで同社が提供していたシステマチックなチャットロボットとは大きく一線を画している。既存のチャットボットでは実現できなかった、自動チャットロボットのみでユーザーの希望する誘導処理を可能としている。

同氏は「他社がカスタマーサービスシステムにどのような会話システムを導入しているかは不明ですが、我々が導入しているようなニューラルネットワークをベースとしたモデリング例は知り得ておらず、先進的なモデルとなるだろう」とその先進性について語っている。

カスタマーサポートをエンドツーエンドで対応可能なモデルのチャットボットは、AIを基に数あるテンプレートからユーザーに最適な会話を通し要望に応えてくれる。テンプレート自体は特段変わったものではなく、商品名、日付、配達日や価格などを的確に含めた上で自然な会話を提供してくれる。

Capture
ユーザーの依頼内容に応じて、アカウント情報の取得まで実施する

同社におけるリサーチャーは、エンドツーエンド対応の実験例として「商品のキャンセル」を挙げている。AIチャットボットはインプットとして、ユーザーがオーダーのキャンセルを求めていることを認識する。そのうえで、ボット自体がユーザーアカウント情報へアクセスし、キャンセルに対応可能かどうかの判断を下すことができる。

同実験では、「Automation Rate(自動化率)」が評価基準とされた。「自動化率」はトランザクション(ユーザーの依頼)が人為的介入なくとも完了すること、また24時間以内の再問合せ率を低くする観点で評価が下される。新しいチャットボットでは、既存エージェントと比較して圧倒的な差を見せたとしている。

調査会社ガートナーによれば、同社は2020末までに自社サービスの85%の顧客対応において、今回導入される自動チャットボットの導入を目指しているとしている。全米の調査で、ユーザーの62%はAIによるチャットボット導入に好意的であり、それにより30%の同ポジションがロボットにとって代わることが予期されている。カスタマーサービスの自動化による企業の予算節約額は、約230億ドルほどともいわれる。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------