BRIDGE

Kyle Wiggers

Kyle Wiggers

テクノロジージャーナリスト。VentureBeat では主に AI の話題を担当。

執筆記事

コロナ禍で「非接触」ドローン配送加速、Flytrexがノースダコタ州でサービスイン

SHARE:

Flytrexは本日(原文掲載日は現地時間で4月24日)、ノースダコタ州グランドフォークスでドローン配送サービスを開始することを発表した。ドローン・アズ・ア・サービス(drone-as-a-service)企業のEASE Drones、グランドフォークス地区の経済開発団体、ノーザン・プランズ無人航空機システム試験場、グランドフォークス市との連携により、同社は食品・医薬品・その他の商品を、提携するレ…

Screen Shot 2020-05-11 at 9.01.40.png
Image Credit : Flytrex

Flytrexは本日(原文掲載日は現地時間で4月24日)、ノースダコタ州グランドフォークスでドローン配送サービスを開始することを発表した。ドローン・アズ・ア・サービス(drone-as-a-service)企業のEASE Drones、グランドフォークス地区の経済開発団体、ノーザン・プランズ無人航空機システム試験場、グランドフォークス市との連携により、同社は食品・医薬品・その他の商品を、提携するレストランや小売店から特定の家庭へドローンを使って配達する。

今回の拡大は、新型コロナウイルスにより世界中で自宅などからの注文が増え、レストランをはじめとした多くの企業が、デリバリーかテイクアウトのみでの提供を強いられていることによるものだ。ドローンや自律走行車は、作業員、宅配業者、顧客の間の不必要な接触を減らし、感染抑制に繋がるとされている。

Flytexによるとグランドフォークス地区で、地元のスーパーセンターの向かい側からドローンを離陸させる予定だ。パイロットプログラムの初期段階では、配達はサービスを選択した世帯のみに提供され、各家のバックヤードに直接配達される。

この展開に先駆けて、Flytrexのオンデマンド・ドローン配送サービスはアイスランドのレイキャビクで開始している。2018年、FlytrexはEASE Dronesと最初の提携を結び、グランドフォークスのキングスウォークゴルフコースでドローン配送を開始した。翌年、Flytrexは連邦航空局(FAA)からノースカロライナ州運輸局とのUAS統合パイロットプログラム(IPP)への参加企業に選ばれている。

2017年に開始されたIPPは、州・地方・部族政府と、ドローン事業者や製造業者などの民間事業体を結びつけ、民間および公共のドローン運用と国の空域システムとの統合をテストし、評価することを目的としている。その他の参加者には、リノ市、アラスカフェアバンクス大学、メンフィス・シェルビー郡空港局、カンザス州運輸局、ハーンドンのイノベーション&アントレプレナーシップ投資局などが含まれる。

他のドローンスタートアップは、シャーロットのNovant Health医療ネットワークのキャンパス周辺にマスクなどの個人用保護具を配達するZiplineや、UPSと提携してローリーのWakeMed病院とガーナーのHealthplexの間で医療品の配達を行うMatternetのように、この期間にノースカロライナ州でサービステストを行なっている(FAAの規格認証135番に基づくと、UPSの子会社であるFlight Forwardは、パイロットが目視できない範囲までドローンを飛行させ、商業的な配達を行うことができる)。

ノースカロライナ州運輸省の職員は、Zipline、Matternet、Flytrexのプログラムから得られたデータを利用して、ドローン技術が国内の他の地域でどのように利用できるか検証すると述べた。個々のドローンミッションのための資金は、民間のパートナーから提供される。

他の場所では、Ziplineのドローンがガーナの農村部から国の首都までCOVID-19の試験サンプルを飛ばしている。AlphabetのWingドローン配送事業は、バージニア、フィンランド、オーストラリアに展開しており、顧客への配送を続けている。また、DJIは災害復旧プログラムを通じ、タルサでホームレスの人々に遠隔支援活動を行い、デイトナビーチでは社会的距離を保つために活用されている。また中国では、Antwork社などが提供する医療用ドローンが、検疫用品や医療サンプルの輸送に利用されている。

※本記事は提携するVenture Beat「Flytrex launches drone delivery service in Grand Forks, North Dakota」の抄訳になります。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

Facebook、ドローンが荷物を運ぶことを「学ぶ方法を学習」するAIを開発

SHARE:

Facebookとカリフォルニア大学バークレー校の研究者チームは、環境力学をモデル化して貨物輸送ドローンに「学ぶ方法を学習」させるためのアプローチを発表した。将来的に倉庫などで予測不可能な事態にも適応できるようなロボットを開発する上で役立つ可能性があるとしている。 同チームは機械学習の一分野である「メタ学習」を使い、吊り下げたペイロードをコントロールするという動的に変化しつづける状況に適応するため…

Facebookとカリフォルニア大学バークレー校の研究者チームは、環境力学をモデル化して貨物輸送ドローンに「学ぶ方法を学習」させるためのアプローチを発表した。将来的に倉庫などで予測不可能な事態にも適応できるようなロボットを開発する上で役立つ可能性があるとしている。

同チームは機械学習の一分野である「メタ学習」を使い、吊り下げたペイロードをコントロールするという動的に変化しつづける状況に適応するためのモデルを学習させた。クアッドコプター自身がコースの途中でターゲットとなる荷物をピックアップする位置を定め、目的地まで運ぶという課題を設けたものだ。

難題の一つは、ドローンからぶら下げたれたケーブルの先に取り付けてある磁石でさまざまな荷物を吊り上げるというところだ。ケーブルが短ければ、磁石はより速く振れることになる。

この難題に対処するため、チームは、磁石の重さやケーブルの長さなどの条件を変えて大量のデータを集め、力学モデルをトレーニングした。さらに環境要因やタスク要因を追加することにより、システムは初めての荷物に遭遇しても順応することができるようになった。これは、まず力学モデルを初期化し、現在の状況を把握し、アクションの結果を予測し、アクションを実行して記憶した結果から力学モデルを再トレーニングすることによって得られたものだという。

トレーニング用の初期データは、様々なペイロード(3Dプリントで作成した重さ10〜15グラムのボックス)をぶら下げたクアッドコプター(DJI Tello)を人間が飛ばすことによって集められた。外部に搭載したRGBカメラで荷物の位置情報を追跡し、0.25秒ごとに記録している。

最終的に1.1時間に及ぶフライトから約1万6,000件のデータポイントを得た。そのうち5%は評価用に使用した。

研究者らの報告によると、クアッドコプターはほとんどの場合、目的地へ荷物を運ぶことができたが、まだ改善の余地はあると言う。このアプローチではぶら下げた荷物の位置を推定するのみであり、荷物を吊り上げたり降ろしたりするタイミングは手動で指定しなければならなかった。これについては今後の課題となる。

論文にはこう書かれている。

これは、実世界のクアッドコプターに実世界のトレーニングデータでメタ学習させ、吊り下げたペイロードの輸送性能を閉ループ制御によって向上させた初のアプローチであると信じています。

今回はクアッドコプターの貨物輸送について特定の課題のみを取り扱いましたが、この方法は汎用可能であり、刻々と変化する条件下で環境とインタラクトするロボティックシステムの構築にも応用することができます。

※本稿は提携するVentureBeat記事の抄訳になります

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

MIT、環境にやさしいAIモデルを論文で発表

SHARE:

MITは最新の論文にて、既存アプローチに比べさらに環境保全に適したAIモデルのトレーニングシステムについて発表した。同論文によれば、モデリングにおける計算効率を向上させることで二酸化炭素の排出を3桁近く抑えられるとする。 AIを利用したモデリングは、例えば画像合成・タンパク質モデリング、自動運転等の分野で多岐に渡り活用されているが、それらの持続的可能性については疑問符が生まれてきている。昨年6月に…

pexels-photo-3641377
Photo by Marcin Jozwiak on Pexels.com

MITは最新の論文にて、既存アプローチに比べさらに環境保全に適したAIモデルのトレーニングシステムについて発表した。同論文によれば、モデリングにおける計算効率を向上させることで二酸化炭素の排出を3桁近く抑えられるとする。

AIを利用したモデリングは、例えば画像合成・タンパク質モデリング、自動運転等の分野で多岐に渡り活用されているが、それらの持続的可能性については疑問符が生まれてきている。昨年6月に、マサチューセッツ大学アマースト校の研究員は、あるモデリングに対して必要な電力量は自動車が排出する米国平均CO2のや約5倍に相当する62万6000ポンドを排出するとのレポートを報告している。

論文で主張される「Once-for-all」ネットワークは、様々なプラットフォームごとに調整可能な多数のサブモデルで構成される事前訓練済みのソリューションだ。各サブモデルでは、ハードウェアの電力と速度の限界と精度・遅延とのトレードオフ関係に基づき、最適なサブモデルを選択する仕組みとなっている。(例えばスマートフォンの場合では、バッテリーや速度、遅延等のトレードオフの最適解に基づいてサブモデルが選択される)。

「Progressive Shrinking」アルゴリズムでは、サブモデル単体の学習効率性をサポートする用途として用いられる。最初に全体のモデルを学習し、続けて学習した全体モデルを同時に利用しながらサブモデルの学習に取り掛かる。最終的には、全てのサブモデルの学習が完了し各プラットフォームに基づいたスピーディーな対応が可能となる。

実験では、1000万以上のアーキテクチャモデルのコンピュータービジョンへのトレーニングは、各サブネットワークに対して費やす時間をはるかに効率性の面で上回ったという。また、このアプローチではモデルの制度並びに効率は失われず、比較して1.5倍から2.6倍の速度を計測したとしている。

現時点においてGitHub上で利用可能なのは、Samsung Galaxy Note8、Samsung Galaxy Note10、Samsung Galaxy S7 Edge、LG G8、Google Pixel、Pixel 2などのデバイスだ。どのデバイスでもIntel XenonやNvidaのGTX 1080Ti、Jetson TX2、V100に対応している。

MITは2017年の論文「Efficient Processing of Deep Neural Networks: A Tutorial and Survey」で既に今回の趣旨と重なる内容を発表していたことは触れておくべきだろう。同研究では、ハードウェア設計変更、コラボレーションやアルゴリズムの変更などAIモデルの計算不可を軽減する方法が複数示されていた。加えて、業界を通したエネルギー消費の分析や機械学習プロジェクトにおけるワット当たりの計算量の標準化の必要性が唱えられていた。

【via Venture Beat】

【原文】

----------[AD]----------

Microsoftが「バグの順位付けAI」開発、数カ月内にオープンソースとして公開へ

SHARE:

Microsoftは、同社に対し顧客から報告されるソフトウェアバグを、セキュリティー・非セキュリティーの括りにて99%の確率で正確に区別し、クリティカルで重要度の高いセキュリティーバグについては平均して97%の成功確率で順位付け可能なシステムを開発した。同システムは数カ月の内に、GitHub上にてオープンソース化されるという。 システムは、AzureDevOpsならびにGitHubレポジトリに保存…

Capture
Microsoft
Image Credit: Khari Johnson / VentureBeat

Microsoftは、同社に対し顧客から報告されるソフトウェアバグを、セキュリティー・非セキュリティーの括りにて99%の確率で正確に区別し、クリティカルで重要度の高いセキュリティーバグについては平均して97%の成功確率で順位付け可能なシステムを開発した。同システムは数カ月の内に、GitHub上にてオープンソース化されるという。

システムは、AzureDevOpsならびにGitHubレポジトリに保存される同社4万7000人のデベロッパー1300万件の作業物・バグデータセットを活用し開発された。Coralogixによれば、開発者は平均して1000行のコード辺り70個のバグを生み出すとしており、バグの修正には1行のコードを書くより30倍の労力を要するとしている。

同社によれば、モデル構築に際しセキュリティーの専門家が承認したトレーニングデータを使用し、統計的サンプリングに基づいてデータのレビューを実施したという。その後、データは「特徴量ベクトル」にエンコードされ、2段階のプロセスを経てシステムの設計が取り組まれる。その後、システムに対しデータがセキュリティーに対しクリティカルかどうかの判断を下すことが出来るよう学習させる。続けて、セキュリティーバグの場合には重要度のラベリングを可能とする学習が施された。

Microsoftが今回開発したモデルでは、バグ予想のために2つの技術を活用している。1つ目がTF-IDF(term frequency-inverse document frequency algorithm)だ。データ内における単語に対し重要度を振りわけ、全体の中でどれだけ関連性があるかを見極めるアプローチとなる。2つ目がロジスティック回帰モデルで、クラスやイベントが発生する確率をロジスティックス関数を基に算出する手法だ。

ソフトウェアにおけるバグを取り除くために、機械学習を使用しているのは同社だけではない。AmazonのCideGuruでは、社内開発のコードレビューやアプリに対して部分的学習を施し、漏洩や無駄なCPUサイクルの過多を発見するために利用されている。Facebookでは、エンジニアの手に届く前にバグ修正を生成するSapFixや、コードの動作と機能をマッピングし、潜在的なバグを探し出すZoncolanと呼ばれるツールが利用されている。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

AIで大学授業に類似したオンライン学習を発見せよ!ーーCourseraがロックダウン対策に乗り出す

SHARE:

オンライン学習スタートアップのCourseraは本日(原文掲載日は4月16日)、大学のコース科目と、Coursera上で提供される学習コンテンツのデータを照合するAIツール「CourseMatch」を発表した。Courseraによれば、同サービスは3月初旬に始まった同社のコロナウイルス対策構想の一部であるという。ロックダウン政策の影響を受け閉鎖を余儀なくされた大学が、授業をCousera上に移行で…

coursera-social-logo
Image Credit : Cousera

オンライン学習スタートアップのCourseraは本日(原文掲載日は4月16日)、大学のコース科目と、Coursera上で提供される学習コンテンツのデータを照合するAIツール「CourseMatch」を発表した。Courseraによれば、同サービスは3月初旬に始まった同社のコロナウイルス対策構想の一部であるという。ロックダウン政策の影響を受け閉鎖を余儀なくされた大学が、授業をCousera上に移行できるようにすることで、学習促進をサポートすることを目的としているという。

Courseraのデータサイエンス担当副社長Emily Glassberg Sands氏とデータサイエンティストのMarianne Sorba氏は以下のように述べている。

同プラットフォームを活用する大学は、彼らが提供していた学科コースに最も類似したCousera上の授業コンテンツの特定を簡易化できるツールを必要としています。これは何千もの大学及び何百万ものキャンパス内コースに共通する課題でした。2週間前、Courseraのデータサイエンスチームは、人的なキュレーションに頼らない、教授達が素早く学習をオンライン化できるソリューション「CourseMatch」の開発に取り組み始めました。

3月25日時点で、9万1,000校以上の公立・私立学校が閉鎖され、5,000万人以上の生徒が影響を受けているという。これらの学校の多くは、異なる学習レベルの生徒に対し、どのような形で授業を提供するかという点などに関して強く悩まされているが、CourseraはCourseMatch がこの問題を解決できると考えている。

CourseMatchは、英語または50以上の言語(翻訳と字幕)のコースのデータを取得する。自然言語処理技術と学習済みの埋め込みワード(語彙から実数までを含む)を活用し、大学の授業コースに最も類似したCourseraの学習コースを見つけ出す設計だ。大学のコース及び授業については、アルゴリズムは一般に公開されているコース名や説明文に加え、より具体的にはシラバスや学習目標などの情報も収集する。一方でCoursera上のコースでは、コースのタイトルや説明文、講義の成績表、課題、評価など、総合的に資料の情報を集めるという。

ある大学内のコースに対して、CourseMatchは、最も関連性の高い Courseraコースを、類似度を表す標準化されたスコアと共に最大5つまで表示する。CourseraによるとCourseMatchは既に、米国のJohnson C. Smith大学とBrown 大学、スペインの IESE、インドのACITEなどを含む1,800校の260万以上のカリキュラムを、Cousera上の何らかのコースにマッチングさせているという。

Glassberg Sands氏とSorba氏は以下のようにコメントを続ける

私たちの目標は、世界中の全ての大学による、迅速かつ簡単なオンライン化を支援することです。今後はフィードバックに基づいて、CouseraMatchの機械学習モデルを改良していくつもりです。世界中の教育機関に同ソリューションを試してみてほしいと考えています。

CourseMatchはCourseraの既存のCoursera for Campusツールをベースにしており、パートナーではない大学でもCourseraのコンテンツを利用して学習を補完できるように設計されている。一方でCoursera for Campusプログラムに登録した大学は、学内の学生、教職員、スタッフに対し、3,600 以上のプログラムを提供することが可能だ。

同サービス内では、工学やビジネス、データサイエンス、法律、健康、芸術、デザインなどの分野で利用できる。大学はこれらの分野は全てそのまま提供することもできるが、Coursera上の別のコンテンツと交換し提供することも可能だ。(もしくは、大学自身で作成したコースと交換することもできる)。

Coursera for Campusの顧客企業は、Course ProgressやSkill Indexなどの分析ダッシュボードや、実習課題用のCoursera Labsなどを含む、Courseraのオンライン評価ツール及びコンテンツ作成ツールを利用することもできる。教授及び教職員は、学生や卒業生を対象としたプライベートレッスン、ハンズオン・プロジェクト、評価、コースを公開することが可能だ。

Courseraによると、3月12日以降、3,000以上の大学及びコミュニティ・カレッジがCoursera for Campusプログラムを利用しているという。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

Google、AIで「男女別翻訳」に対応

SHARE:

Googleは4月22日、文法上の男女別に翻訳する機能を英語からスペイン語、そしてフィンランド語・ハンガリー語・ペルシャ語から英語へのGoogle翻訳においてリリースすることを発表した。新しいパラダイムを活用して翻訳結果を性別に対応した文章に修正することにより、ジェンダーバイアスの問題に対処する。 同社は、すでにトルコ語から英語への男女別翻訳を提供していたが、その根幹となる技術は主にジェンダー中立…

Google via Flickr by YsfYlmz

Googleは4月22日、文法上の男女別に翻訳する機能を英語からスペイン語、そしてフィンランド語・ハンガリー語・ペルシャ語から英語へのGoogle翻訳においてリリースすることを発表した。新しいパラダイムを活用して翻訳結果を性別に対応した文章に修正することにより、ジェンダーバイアスの問題に対処する。

同社は、すでにトルコ語から英語への男女別翻訳を提供していたが、その根幹となる技術は主にジェンダー中立かどうかをデータ集約的に検出する仕組みであった。今回のアプローチはそうではないため、よりスケーラブルだとしている。Google ResearchのシニアソフトウェアエンジニアであるMelvin Johnson氏はこう述べている。

男女別翻訳の質を高め、さらに4つの言語ペアに拡張することで、初めにローンチしたものよりも格段に進化しました。ジェンダーバイアスにさらに取り組んでいくことを約束し、ドキュメントレベルの翻訳にも拡大する予定です。

Johnson氏の説明によると、トルコ語から英語への男女別翻訳に使用されていた従来の分類子は、新しい言語に適応するのに手こずり、ニューラル機械翻訳(NMT)システムを使用して男女別翻訳を個別に出力することができなかったという。さらに、適格なクエリに対して男女別翻訳を表示することができなかった割合は最大40%だった。これは、男女別翻訳結果が、ジェンダーに関する部分以外でも一致しないことが多いからだ。

対照的に、新しいリライトベースの手法では、まず翻訳を生成し、次にそれらをレビューして、ジェンダー中立のソースフレーズからジェンダー固有の翻訳を生み出すインスタンスを特定。それが正しければ、センテンスレベルのリライターがもう片方の性の翻訳文を出力する。最後に、初めの翻訳文とリライトされた翻訳文をレビューし、違いがジェンダーだけであることを確認する。

Googleによると、このリライターは男性形・女性形のフレーズのペアからなるトレーニング用の例文を数百万件使用して構築された。Google翻訳チームは、一言語の膨大なデータセットに対し、性の区別のある代名詞を男性形から女性形(またはその逆)に交換することでリライト候補文を用意した。エンジニアが開発した言語モデルを数百万件の英文でトレーニング。コーパスから、男性形のインプットから女性形のアウトプット、またはその逆のトレーニングデータを抽出した。

双方向のトレーニングデータをマージしたものを使って、1層のTransformerベースのシーケンス間モデルをトレーニングした。次に句読点や大文字・小文字のバリエーションをつけたトレーニングデータでモデルの堅牢性を高め、最終的に男性形または女性形へのリライトを99%の割合で確実に生成できるようになった。

Johnson氏によると、Googleが開発したバイアスリダクションという測定基準で新旧の翻訳システムのバイアス減少率を測定したところ(ここでいう「バイアス」とは、ソースには男女の区別がないのに翻訳結果にはどちらか一方の性が選択されてしまうことを指す)、ハンガリー語、フィンランド語、ペルシャ語から英語への翻訳においてバイアスが90%以上減少。トルコ語から英語への翻訳については60%から95%に改善された。性別の正確性(性別を指定した場合に正しい男女別で翻訳できる割合)は平均97%だった。

改良版のGoogle翻訳システムは、同社がCloud Vision APIから人々の画像を「男性」「女性」とラベル付けする機能を削除してから数カ月後にロールアウトされる。これとは別に、2018年1月、GoogleはGmailの文章を自動的に補完する機能、Smart Composeにおいても推定される性別に基づいた男女別代名詞を使うことを中止している。

翻訳やコンピュータビジョンへのジェンダー中立なアプローチは、AIシステムから偏見をなくすためにGoogleが行っている大規模な取り組みのほんの一部だ。マウンテンビューに本社を置く同社では、AI倫理チームが開発したテストでバイアスを割り出し、予測技術から暴言、人種差別、ライバル会社への中傷や悲劇的な出来事への言及を取り除いている。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

Amazon Alexa、より自然な口調でテキストを読み上げられるように

SHARE:

Amazonは4月16日、サードパーティが提供するAlexaスキル(音声アプリなど)のニュースや音楽コンテンツ向けに、長文用の口調スタイルを発表した。ウェブページや記事、ポッドキャスト、ゲームのストーリーなどといった多様なテキスト情報に対応しており、米国の開発者は今週(4月第3週)から利用開始できる。 テキストをより自然に読み上げ、ユーザのエンゲージメントを上げることで体験の向上が見込まれる。加え…

Amazon Echo Dot Clock
Image Credit: Khari Johnson / VentureBeat

Amazonは4月16日、サードパーティが提供するAlexaスキル(音声アプリなど)のニュースや音楽コンテンツ向けに、長文用の口調スタイルを発表した。ウェブページや記事、ポッドキャスト、ゲームのストーリーなどといった多様なテキスト情報に対応しており、米国の開発者は今週(4月第3週)から利用開始できる。

テキストをより自然に読み上げ、ユーザのエンゲージメントを上げることで体験の向上が見込まれる。加えて、プロの声優を雇う必要がないので開発者にとってはコスト削減になり、スタジオでレコーディングするよりも時間の節約になる。

Amazonによると、この長文用の口調スタイルは、AIによるテキスト読み上げモデルを採用しており、段落と段落、セリフとセリフのあいだに自然な間が組み込まれている。同様に、Googleアシスタントにも最近、webサイトやAndroidアプリ内でより自然で人間らしい音声で長文コンテンツを読み上げる機能がローンチされた。

聞いてみてほしい。(編集部注:音声データは原文サイトをご確認ください)

【音声1】

こちらがAlexaのデフォルトスタイルだ。

【音声2】

長文用の口調スタイル以外にも、開発者はAmazon Pollyのニュース読み上げ・会話スタイルを利用することができる。Amazon PollyはAmazonのクラウドサービスの1つで、テキストを生き生きとした音声に変換するサービスだ。Alexaスキルの言語は29カ国語に対応しており、声質はMatthew、Joanna、Lupeから選ぶことができる。ニューススタイルはまるでテレビのアナウンサーやラジオのパーソナリティが話しているかのように聞こえる。会話スタイルの場合は堅苦しさがなく、あたかも友達や家族と話しているかのようだ。

昨年、AmazonはAIによって生成された音声に関する詳細な研究論文を発表した。声優が身に付けるには数十時間はかかるであろう口調スタイルを、わずか数時間のトレーニングで習得することができるシステムについて述べている。同社のモデルは、一連の音素をスペクトログラムに変換する生成系ニューラルネットワークからなり、時間軸に沿って変化する音声周波数のスペクトラムを視覚的に表現する。そうしたスペクトログラムを連続的なオーディオ信号に変換するボコーダもついている。

ひいては、AIモデルによって、大量のニュートラルな話し方の音声データと特定の話し方による数時間程度の音声データを結びつけるトレーニング方法を生み出し、口調スタイルとは無関係な要素と固有な要素の両方を識別できるAIシステムを開発している。Amazonはこれを利用してAlexa用の新ボイスやAmazon Pollyで多言語に渡る開発者向けボイスを制作している。

最後に、Amazonによると、Alexa用音声アプリの開発者は、アメリカ英語、アメリカスペイン語、カナダフランス語、ブラジルポルトガル語など、6つの言語による10種類の音声をAmazon Pollyから追加で使用することができる。

これらの開発に先立ち、AmazonはAlexaスキル用の口調として「うれしい・わくわくする」、「がっかり・同情」、短めのニューススタイル、音楽スタイルをリリース。11月にはブログで、感情をもたせた音声によってAlexaの標準音声よりも顧客満足度が30%上昇し、ニューススタイルおよび音楽スタイルについては自然度がそれぞれ31%、84%上昇したとしている。

Amazonは最近、AIを駆使して特注の話者を生成するAmazon Pollyの機能、「Brand Voices」もローンチした。このサービスでは顧客と社内エンジニアが協同して特定のペルソナを表す音声をAIで作り上げる。たとえばカナダのKFCには南米なまりの口調、ナショナルオーストラリア銀行にはオーストラリア英語といった具合だ。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

GoogleのPixel4、AIで人の顔を3D化できるように

SHARE:

Googleは10日、Pixel4またPixel4 XLにビルトインされるuDepthを利用した、リアルタイム・ポイントクラウドを可視化するデモアプリをリリースした。同技術は機械学習を利用し、なりすましによる悪用を防ぐことができるとする。背景のぼかしや、ポートレート機能、3D写真など数多くの機能を持つ。 uDepthはPixel4シリーズにのみ配信されることが想定される。しかし、同技術はロボット工…

pjimage-1.jpg
Screenshots captured from Google’s new uDepth visualizer for the Pixel 4.
Image Credit: Google

Googleは10日、Pixel4またPixel4 XLにビルトインされるuDepthを利用した、リアルタイム・ポイントクラウドを可視化するデモアプリをリリースした。同技術は機械学習を利用し、なりすましによる悪用を防ぐことができるとする。背景のぼかしや、ポートレート機能、3D写真など数多くの機能を持つ。

uDepthはPixel4シリーズにのみ配信されることが想定される。しかし、同技術はロボット工学など、正確な深度センシングが求められるエリアにて応用されることが予期できる。また、コンピュータービジョンへの応用、ロボットによるプロセスオートメーション等に応用されることも期待できるだろう。

Google Pixel 4 uDepth
uDepthを基に生成されたビジュアルデータ

uDepthはつい先日にAPIとして公開され、Pixel4のカメラアプリにあるSocial Media Depth設定の項目から利用可能だ。同技術は赤外線パターンプロジェクター、また同デバイス専用のニューラルチップ(Pixel Neural Core)を利用している。奥行きを保ったフレーム生成のため、1つ目のカメラで画像における周辺領域をキャプチャーし、2つ目のカメラで共通領域を探し出す。これらにより検出されたデータに対し赤外線パターンを投影することで、各領域を識別しやすくする仕組みとなる。

領域識別の際、uDepthは相互に重なり合っていない画像タイルを比較し、それぞれの深層度を比較している。(機械学習を利用し、明るさと隣接情報をモデリングすることで、1.5ミリ秒/フレーム以下で修正を実施する)。

またuDepthではカラー画像、人物識別、深度を組み合わせたAIモデルを活用し、3Dにおける深度マップを推定する。Googleによれば、同モデル作成に際しては、高解像度の配列カメラ、331個のLED照明、高解像度深度センサーを備えた設備を用意し学習を繰り返したという。

Google Pixel 4 uDepth

uDepthソフトウェアリードのMichael Schoenberg氏・GoogleリサーチのAdaesh Kowdle氏は同社ブログにて以下のように述べている。

「深度センシングと呼ぶ、3D情報の測定を実施する技術は開発者・ユーザーどちらにも有益で貴重なツールです。しかし、典型的なRGBベースの技術では計算コストが高く、テクスチャーの低い環境や、明かりが少ない環境ではではうまく動作しない可能性がありました。Pixelでは、高速かつ暗闇での動作が求められていたため、今回のようなアプローチが望ましいという結論に至りました」。

※本稿は提携するVentureBeatの記事の抄訳

【via Venture Beat】

【原文】

----------[AD]----------

MicrosoftのAIは、ビデオクリップの字幕が真実かどうかを判断しようとしている

SHARE:

※本記事は提携するVentureBeat「Microsoft’s AI determines whether statements about video clips are true」の抄訳になります。 プレプリントサーバーArxiv.orgに公開された論文の中で、カーネギーメロン大学、カリフォルニア大学サンタバーバラ校、マイクロソフトのDynamics 365 AIリサーチの研究者たちは、動画…

microsoft-1-e1580261336710.jpg
Microsoft
Image Credit: Khari Johnson / VentureBeat

※本記事は提携するVentureBeat「Microsoft’s AI determines whether statements about video clips are true」の抄訳になります。

プレプリントサーバーArxiv.orgに公開された論文の中で、カーネギーメロン大学、カリフォルニア大学サンタバーバラ校、マイクロソフトのDynamics 365 AIリサーチの研究者たちは、動画と言語の推論について説明している。

これはAIがビデオクリップに含む字幕をもとに、内容が合っているか矛盾しているかを推論するものだ。動画と言語の理解に関する調査をさらに進め、企業で使用される会議用の自動テープ起こしツールを強化することを目的としている。

研究者たちが説明するように、動画と言語の推論には、ビジュアルとテキストの両方の手がかりを徹底的に解釈する必要がある。 そのため研究者らは、 Amazon Mechanical Turkを介したクラウドソーシングワーカーが、字幕付き動画を視聴して作成したステートメントを、現実のシーンでの発言と組み合わせたビデオデータセットとして紹介している。

ワーカーたちは、動画と字幕の両方を理解した上で、動画の中の明らかな情報(オブジェクト、場所、キャラクター、社会活動など)を記述し、さらに複雑なプロット(各出来事の理解、人間の感情や関係性の解釈、出来事の因果関係の推論)への理解度を明らかにするためのステートメントを書いた。

081c9a32-1f1f-47dc-9020-38f07d18d134.png

このデータセットには、「フレンズ」、「デスパレートな妻たち – Desperate Housewives」、「 ママと恋に落ちるまで – How I Met Your Mother」、「モダン・ファミリー」などのYouTubeやテレビドラマシリーズから、合計582時間に及ぶ95,322組以上の動画ステートメントと15,887本の映画が含まれる。

それぞれ約30秒の動画は、ポジティブまたはネガティブな6つのステートメントとセットになっており、それは登場人物を特定したり、行動を認識したり、会話やその理由を推論をしたり、人間の動きについて言及したりしている(偏りを防ぐために、否定的なステートメントを収集する際には肯定的なステートメントを参照し、その一部だけを修正して否定的なものにするように依頼した)。

データセットをベンチマークするために、共同研究者らは、動画の特徴を数値化してエンコードできるよう、長期依存性を学習できるAIモデルの一種である双方向性長期短期記憶モデルを採用し、 別のモデルではステートメントと字幕をエンコードした。 動画、字幕、ステートメントが与えられると、データセットの80%による学習、10%による妥当性の確認、10%によるテストにより学習した別のモデルが、ステートメントが動画と字幕に合っているか矛盾するかを判断する。 人間が行った場合85.20%の精度なのに対して、最も性能の高いベースラインは59.45%の精度を達成したという。

「ベースラインモデルと人間の性能の差は大きい。このタスクにコミュニティにも参加してもらい、マルチモーダル推論の最先端を行くために、より強力なメソッドを発明していきたい。今後の可能性としては、キーフレームをローカライズするモデルの開発や、推論能力を向上させるために動画と字幕のアライメントを改善していくことなどが挙げられる」と研究者は述べている。

この研究は、Microsoft Research Asiaとハルビン工科大学による研究に続いており、コメント、ビデオ、オーディオの間の表現をキャプチャすることで、AIを使って動画のキャプションを生成しようとしている。システムのコードはGitHubで公開されており、候補セットから最も関連性の高いコメントと動画を照合し、クロスモーダル表現を共同で学習する。

【via VentureBeat】 @VentureBeat

【原文】

 

081c9a32-1f1f-47dc-9020-38f07d18d134.png

----------[AD]----------

感染拡大に力を発揮する自律走行車たち、検体輸送に医療従事者への食事配送まで

SHARE:

メイヨー・クリニックは今日(注:原文掲載日は現地時間4月2日)、Bestmile社およびJacksonville交通局(JTA)との提携を発表し、病院のドライブスルー検査場で収集した医療機器、およびCOVID-19検査結果を輸送するための、自律型シャトルを配備することを発表した。コロナウイルス感染拡大のリスクを軽減しつつ、必要とされる物資の配送を迅速化することが期待されている。 メイヨー・クリニッ…

39a7bd2d-bf68-4c4c-8485-c83d6c1b2033.png
Beep社が提供する自律走行バスのひとつ
Image Credit: Beep

メイヨー・クリニックは今日(注:原文掲載日は現地時間4月2日)、Bestmile社およびJacksonville交通局(JTA)との提携を発表し、病院のドライブスルー検査場で収集した医療機器、およびCOVID-19検査結果を輸送するための、自律型シャトルを配備することを発表した。コロナウイルス感染拡大のリスクを軽減しつつ、必要とされる物資の配送を迅速化することが期待されている。

メイヨー・クリニックはフロリダの院にて、3月30日からBeep社とNavya社の提供する4つの自律走行シャトルを使用し始めたそうだ。これは院の検査場から病院のキャンパス内にある処理研究所にCOVID-19検査を輸送するために使われている。なお、Beep社はオーランド郊外のNona湖から3台のシャトルを輸送しているのだが、これはJTAにて現在進行中の自律走行車プログラムで追加されたものだ。

COVID-19の試験サンプルは、メイヨー・クリニックのスタッフがシャトルに内容物を積み込む前に、安全なコンテナに保管されることになる。

このパートナーシップは規模は小さいが、世界的なトレンドに沿ったものとなる。COVID-19の影響を受けた地域に医薬品を届けるために、自律走行車が医療システムに利用されるようになっている。

中国では新興企業のNeolix(新石器)社が提供するバンが、COVID-19の影響を最も強く受けた地域に医療品を届け、人手不足を補っているそうだ。Baidu(百度)社の自律走行車プラットフォーム「Apollo」との連携により、これらのバンは北京で病気になった人々の看病をしている医療従事者に食料を届けるという仕事を担っている。

また3月中旬には、KiwiBot社の自律配送ロボットが、バークレーとデンバーのコミュニティに衛生用品やマスク、抗菌ジェル、衛生用品などの配送を開始している。

以前の本誌インタビューでTactile MobilityのCEO、Amit Nisenbaum氏は自律走行車の意義を「配達ロボットは命の危険を犯さず利便性と安全性を担保してくれる。しかも今、人々は自律走行車が【ソーシャルディスタンス】を保ち、感染の拡大防止に役立つことを理解している」と語っている。同社は自律走行車が道路の段差やカーブ、危険を検知できるようにする触覚データとセンシング技術を提供する企業だ。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------