BRIDGE

Kyle Wiggers

Kyle Wiggers

テクノロジージャーナリスト。VentureBeat では主に AI の話題を担当。

執筆記事

深圳発・非接触配膳ロボット開発のPudu(普渡)、シリーズBで1,500万米ドルを調達——新型コロナ患者への配膳自動化で注目を集める

SHARE:

深圳を拠点とするロボット研究開発スタートアップ Pudu Technology(普渡科技)は1日、1,500万米ドルのラウンドを発表した。同社は、シェラトン や JD.com(京東)など、20カ国2,000以上のホテル、レストラン、病院を顧客に抱えている。今回の調達資金は、新製品の開発や販売拡大、海外市場の開拓に使われる。 新型コロナウイルスの感染拡大が非接触型ロボットソリューションの需要を加速さ…

Image credit: Pudu Technology(普渡科技)

深圳を拠点とするロボット研究開発スタートアップ Pudu Technology(普渡科技)は1日、1,500万米ドルのラウンドを発表した。同社は、シェラトン や JD.com(京東)など、20カ国2,000以上のホテル、レストラン、病院を顧客に抱えている。今回の調達資金は、新製品の開発や販売拡大、海外市場の開拓に使われる。

新型コロナウイルスの感染拡大が非接触型ロボットソリューションの需要を加速させている。顧客や配達員のお互い人ではなく消毒されたロボットに触れることになるため、感染の拡大は抑えられると同時に、オンデマンド配達にも対応できると期待されている。

Puduは、低速で自律的な自己充電型ロボットを多数販売しており、接客やサービスの現場で商品を運び、顧客と対話するように設計されている。「BellaBot(貝拉)」は、同社が「フル次元の知覚を持つ配送ロボット」と説明しているが、安定性を高めるための連鎖サスペンションシステムと、障害物回避センサーを内蔵した組み立て台座を特徴としている。「Holabot(好啦)」は配膳をこなすために設計されており、高い運搬能力(120リットル)、耐水設計、ジェスチャー認識機能などを備えている。

Image credit: Pudu Technology(普渡科技)

Pudu によれば、新型コロナウイルスが感染拡大する中、同社のロボットは、ソウル、北京、武漢を中心に、世界中の何百もの病院で非接触配膳サービスを提供してきた。同社によると、同社のロボット1台で1日に最大300トレーの食事を配膳することが可能で、ピーク時には400トレーを超えることもある。

Pudu のロボットはすべて、毎秒18,000回の光をサンプリングする特注設計のレーダーセンサー「Pudu X EAI」を搭載している。これはカメラやレーダー、慣性計測ユニット、深度センサーなどの様々なセンサーを利用して、コンマ数センチメートルレベルのリアルタイム測位と地図作成を実現する、同社独自の同時定位マッピング(SLAM)アルゴリズムの一部だという。

Pudu はソフトウェア面では Pudu Cloud(普渡雲)を提供しており、ビジネス、オペレーション、メンテナンス管理、シナリオデータ収集などを処理する。例えば、Pudu Scheduler を利用することで、顧客はロボットを同じネットワーク上の他のロボットと直接通信させることができ、サーバーを一切必要としない。AI 音声モジュールは、何百もの対話コンテキストをサポートしている。また、クロスプラットフォームのアプリにより、スマートウォッチ、タブレット、ポケベル、スマートフォンからのモニターが可能だ。

Image credit: Pudu Technology(普渡科技)

北京を拠点とする e コマース企業 Meituan-Dianping(美団点評)は、Pudu への今回の最新ラウンドを単独で主導した。シリーズ B は、2018年6月の5,000万人民元(約7.6億円)の前回ラウンド完了に続くもので、Pudu の累計調達総額は2,000万米ドルを超えている。

Pudu の他の注目すべき顧客には、四川を拠点とする火鍋レストランチェーン「Haidilao(海底撈)」やフードデリバリアプリ「配達の民族(배달의민족)」を運営する Woowa Brothers(우아한형제들)などがあり、同社は昨年、5,000台以上のロボットを販売している。Pudu は現在、深圳の本社、成都の支店、中国の60以上の都市にあるサービスセンターで100人以上の従業員を雇用している。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

Facebook、プログラムコードを別のプログラミング言語に翻訳する「TransCoder AI」を開発

SHARE:

FacebookはC++、Java、Pythonなどの高水準言語で書かれたプログラムコードを別のプログラミング言語に変換するニューラルトランスコンパイラを開発したという。このシステムは教師なし学習を採用しており、同社は従来よりもかなり効率が改善したとしている。 既存のプログラムコードを別の言語に移行するには、両方の言語について専門的な知識が必要な上、コストがかかってしまいがちだ。たとえばオーストラ…

FacebookはC++、Java、Pythonなどの高水準言語で書かれたプログラムコードを別のプログラミング言語に変換するニューラルトランスコンパイラを開発したという。このシステムは教師なし学習を採用しており、同社は従来よりもかなり効率が改善したとしている。

既存のプログラムコードを別の言語に移行するには、両方の言語について専門的な知識が必要な上、コストがかかってしまいがちだ。たとえばオーストラリアのコモンウェルス銀行はプラットフォームをCOBOLからJavaに移行するために5年の歳月と約7億5,000万米ドルを費やした

Facebookは教師なし学習というアプローチ法に取り組み、C++、Java、Python間でソースコードを変換することができる「TransCoder」を開発した。トレーニングには280万件以上のオープンソースリポジトリからなるGitHubコーパスを使用した。TransCoderは元のプログラムコードを別の言語へ変換し、変換したプログラムコードを元の言語へ再度変換することを繰り返して学習している。

TransCoderのパフォーマンス評価にはGeeksforGeeks(コーディングの問題点や解決方法を集めたオンラインプラットフォーム)から抽出したC++、Java、Pythonの関数852個を使用した。Facebookによると、最も評価の高かったバージョンのTransCoderは、厳密に言えば同一の関数を生成していないことが多かったが、計算精度が高かった。以下にTransCoderが期待される結果を返した割合をまとめる。

  • C++からJavaへの変換:74.8%
  • C++からPythonへの変換:67.2%
  • JavaからC++への変換:91.6%
  • PythonからJavaへの変換:56.1%
  • PythonからC++への変換:57.8%
  • JavaからPythonへの変換:68.7%

TransCoderが各言語に特有のシンタックスを理解するだけでなく、言語のデータ構造やメソッドも理解したことが証明されたと研究者らは述べている。

専門知識を持たなくても、TransCoderを使えばあらゆるプログラミング言語で容易にソースコードを生成できます。しかも商業用のソリューションを大幅に上回っています。

AIによるコード生成システムを開発しているのはFacebookだけではない。今年行われたMicrosoftのカンファレンス「Build」では、OpenAIが英文で書かれたコメントから関数を生成するモデルをデモンストレーションした。2年前にはライス大学の研究者が「意図」を読み取ってコードを生成する「Bayouというシステムを作っている。

Intel Labsの主任研究者兼ディレクターのJustin Gottschlich氏はVentureBeatのインタビューに対してこう語った。

これらはソフトウェア開発の無駄を取り除いてくれます。バグ対応の手間が省けるので、プロダクティビティの加速化に役立ちます。そして新たな職を生み出します。なぜならプログラミングをしたことのない人々でもこれらのインターフェイスを通じてクリエイティブな直観を形にすることができるからです。

※本稿は提携するVentureBeat記事の抄訳になります

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

Google、障害を持つ人でもインターネットにアクセスしやすくなるツール類を公開

SHARE:

Googleは第9回Global Accessibility Awareness Dayを記念して、ホーム画面をタップするだけであらゆる機能へのアクセスが可能なアプリ「Action Blocks」をリリースした。また、Live TranscribeやSound AmplifierなどAIを活用したアクセシビリティーツールも同時にリリースしている。 ある調査によれば、身体的ディスアビリティーは依然と…

pexels-photo-218717
Photo by PhotoMIX Company on Pexels.com

Googleは第9回Global Accessibility Awareness Dayを記念して、ホーム画面をタップするだけであらゆる機能へのアクセスが可能なアプリ「Action Blocks」をリリースした。また、Live TranscribeやSound AmplifierなどAIを活用したアクセシビリティーツールも同時にリリースしている。

ある調査によれば、身体的ディスアビリティーは依然としてテクノロジー機器利用の大きな障害となっていると言われている。Pew Research Centerが2016年に公開した調査によれば、身体に障害を持つ人は、ない人に比べてインターネットの利用を控えるケースが約3倍に上るとしている。また、コンピューターやスマホなどの利用率も20%ほど低いという。GoogleやMicrosoft、アマゾンもそうしたアクセシビリティーツールの開発のため、AIへの投資を実施している。

今回GoogleがリリースしたAction Blocksは、Googleアシスタントが現状対応できる機能については全て持ち合わせており、その他機能についても数多くに対応する。機能面ではAppleのSiri Shortcutsに似ている。

Google Action Blocks

また、Googleは耳の聞こえない人や難聴といった障害を抱える人向けにリアルタイムで会話音声をテキストへと変換する機能「Live Transcribe」のアップデートを実施した。同アップデートでは、近場にいる人が設定された名前を呼びかければ自動でバイブレーションする機能が実装された。また、ローカルデバイスに保存されている過去3日分の会話を検索することができる機能も実装されている。対応言語もアルバニア語、ビルマ語、エストニア語、マケドニア語、モンゴル語、パンジャブ語、ウズベク語へと拡充された。

Google Sound Amplifier

また、外部のノイズを取り除くSound AmplifierがBluetooth接続されるヘッドフォンに対応するアップデートが行われた。Chromeへは、概要ラベルの付いていない画像をAIを通し分析るることが出来る機能「Get Image Descriptions」がフランス語、ドイツ語、ヒンディー語、イタリア語、スペイン語に新たに対応している。

音声認識機能「Voice Access」では、「ズームイン、拡大、左へ移動、右へ移動」を認識し画面移動が可能となった。Google Mapsでは、検索から指定する場所のアクセシビリティー情報の取得が可能となった。オーストラリア、日本、イギリス、アメリカの’1500万以上の場所が対象となっている。

※本稿は提携するVentureBeat記事の抄訳になります

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

コロナ禍で「非接触」ドローン配送加速、Flytrexがノースダコタ州でサービスイン

SHARE:

Flytrexは本日(原文掲載日は現地時間で4月24日)、ノースダコタ州グランドフォークスでドローン配送サービスを開始することを発表した。ドローン・アズ・ア・サービス(drone-as-a-service)企業のEASE Drones、グランドフォークス地区の経済開発団体、ノーザン・プランズ無人航空機システム試験場、グランドフォークス市との連携により、同社は食品・医薬品・その他の商品を、提携するレ…

Screen Shot 2020-05-11 at 9.01.40.png
Image Credit : Flytrex

Flytrexは本日(原文掲載日は現地時間で4月24日)、ノースダコタ州グランドフォークスでドローン配送サービスを開始することを発表した。ドローン・アズ・ア・サービス(drone-as-a-service)企業のEASE Drones、グランドフォークス地区の経済開発団体、ノーザン・プランズ無人航空機システム試験場、グランドフォークス市との連携により、同社は食品・医薬品・その他の商品を、提携するレストランや小売店から特定の家庭へドローンを使って配達する。

今回の拡大は、新型コロナウイルスにより世界中で自宅などからの注文が増え、レストランをはじめとした多くの企業が、デリバリーかテイクアウトのみでの提供を強いられていることによるものだ。ドローンや自律走行車は、作業員、宅配業者、顧客の間の不必要な接触を減らし、感染抑制に繋がるとされている。

Flytexによるとグランドフォークス地区で、地元のスーパーセンターの向かい側からドローンを離陸させる予定だ。パイロットプログラムの初期段階では、配達はサービスを選択した世帯のみに提供され、各家のバックヤードに直接配達される。

この展開に先駆けて、Flytrexのオンデマンド・ドローン配送サービスはアイスランドのレイキャビクで開始している。2018年、FlytrexはEASE Dronesと最初の提携を結び、グランドフォークスのキングスウォークゴルフコースでドローン配送を開始した。翌年、Flytrexは連邦航空局(FAA)からノースカロライナ州運輸局とのUAS統合パイロットプログラム(IPP)への参加企業に選ばれている。

2017年に開始されたIPPは、州・地方・部族政府と、ドローン事業者や製造業者などの民間事業体を結びつけ、民間および公共のドローン運用と国の空域システムとの統合をテストし、評価することを目的としている。その他の参加者には、リノ市、アラスカフェアバンクス大学、メンフィス・シェルビー郡空港局、カンザス州運輸局、ハーンドンのイノベーション&アントレプレナーシップ投資局などが含まれる。

他のドローンスタートアップは、シャーロットのNovant Health医療ネットワークのキャンパス周辺にマスクなどの個人用保護具を配達するZiplineや、UPSと提携してローリーのWakeMed病院とガーナーのHealthplexの間で医療品の配達を行うMatternetのように、この期間にノースカロライナ州でサービステストを行なっている(FAAの規格認証135番に基づくと、UPSの子会社であるFlight Forwardは、パイロットが目視できない範囲までドローンを飛行させ、商業的な配達を行うことができる)。

ノースカロライナ州運輸省の職員は、Zipline、Matternet、Flytrexのプログラムから得られたデータを利用して、ドローン技術が国内の他の地域でどのように利用できるか検証すると述べた。個々のドローンミッションのための資金は、民間のパートナーから提供される。

他の場所では、Ziplineのドローンがガーナの農村部から国の首都までCOVID-19の試験サンプルを飛ばしている。AlphabetのWingドローン配送事業は、バージニア、フィンランド、オーストラリアに展開しており、顧客への配送を続けている。また、DJIは災害復旧プログラムを通じ、タルサでホームレスの人々に遠隔支援活動を行い、デイトナビーチでは社会的距離を保つために活用されている。また中国では、Antwork社などが提供する医療用ドローンが、検疫用品や医療サンプルの輸送に利用されている。

※本記事は提携するVenture Beat「Flytrex launches drone delivery service in Grand Forks, North Dakota」の抄訳になります。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

Facebook、ドローンが荷物を運ぶことを「学ぶ方法を学習」するAIを開発

SHARE:

Facebookとカリフォルニア大学バークレー校の研究者チームは、環境力学をモデル化して貨物輸送ドローンに「学ぶ方法を学習」させるためのアプローチを発表した。将来的に倉庫などで予測不可能な事態にも適応できるようなロボットを開発する上で役立つ可能性があるとしている。 同チームは機械学習の一分野である「メタ学習」を使い、吊り下げたペイロードをコントロールするという動的に変化しつづける状況に適応するため…

Facebookとカリフォルニア大学バークレー校の研究者チームは、環境力学をモデル化して貨物輸送ドローンに「学ぶ方法を学習」させるためのアプローチを発表した。将来的に倉庫などで予測不可能な事態にも適応できるようなロボットを開発する上で役立つ可能性があるとしている。

同チームは機械学習の一分野である「メタ学習」を使い、吊り下げたペイロードをコントロールするという動的に変化しつづける状況に適応するためのモデルを学習させた。クアッドコプター自身がコースの途中でターゲットとなる荷物をピックアップする位置を定め、目的地まで運ぶという課題を設けたものだ。

難題の一つは、ドローンからぶら下げたれたケーブルの先に取り付けてある磁石でさまざまな荷物を吊り上げるというところだ。ケーブルが短ければ、磁石はより速く振れることになる。

この難題に対処するため、チームは、磁石の重さやケーブルの長さなどの条件を変えて大量のデータを集め、力学モデルをトレーニングした。さらに環境要因やタスク要因を追加することにより、システムは初めての荷物に遭遇しても順応することができるようになった。これは、まず力学モデルを初期化し、現在の状況を把握し、アクションの結果を予測し、アクションを実行して記憶した結果から力学モデルを再トレーニングすることによって得られたものだという。

トレーニング用の初期データは、様々なペイロード(3Dプリントで作成した重さ10〜15グラムのボックス)をぶら下げたクアッドコプター(DJI Tello)を人間が飛ばすことによって集められた。外部に搭載したRGBカメラで荷物の位置情報を追跡し、0.25秒ごとに記録している。

最終的に1.1時間に及ぶフライトから約1万6,000件のデータポイントを得た。そのうち5%は評価用に使用した。

研究者らの報告によると、クアッドコプターはほとんどの場合、目的地へ荷物を運ぶことができたが、まだ改善の余地はあると言う。このアプローチではぶら下げた荷物の位置を推定するのみであり、荷物を吊り上げたり降ろしたりするタイミングは手動で指定しなければならなかった。これについては今後の課題となる。

論文にはこう書かれている。

これは、実世界のクアッドコプターに実世界のトレーニングデータでメタ学習させ、吊り下げたペイロードの輸送性能を閉ループ制御によって向上させた初のアプローチであると信じています。

今回はクアッドコプターの貨物輸送について特定の課題のみを取り扱いましたが、この方法は汎用可能であり、刻々と変化する条件下で環境とインタラクトするロボティックシステムの構築にも応用することができます。

※本稿は提携するVentureBeat記事の抄訳になります

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

MIT、環境にやさしいAIモデルを論文で発表

SHARE:

MITは最新の論文にて、既存アプローチに比べさらに環境保全に適したAIモデルのトレーニングシステムについて発表した。同論文によれば、モデリングにおける計算効率を向上させることで二酸化炭素の排出を3桁近く抑えられるとする。 AIを利用したモデリングは、例えば画像合成・タンパク質モデリング、自動運転等の分野で多岐に渡り活用されているが、それらの持続的可能性については疑問符が生まれてきている。昨年6月に…

pexels-photo-3641377
Photo by Marcin Jozwiak on Pexels.com

MITは最新の論文にて、既存アプローチに比べさらに環境保全に適したAIモデルのトレーニングシステムについて発表した。同論文によれば、モデリングにおける計算効率を向上させることで二酸化炭素の排出を3桁近く抑えられるとする。

AIを利用したモデリングは、例えば画像合成・タンパク質モデリング、自動運転等の分野で多岐に渡り活用されているが、それらの持続的可能性については疑問符が生まれてきている。昨年6月に、マサチューセッツ大学アマースト校の研究員は、あるモデリングに対して必要な電力量は自動車が排出する米国平均CO2のや約5倍に相当する62万6000ポンドを排出するとのレポートを報告している。

論文で主張される「Once-for-all」ネットワークは、様々なプラットフォームごとに調整可能な多数のサブモデルで構成される事前訓練済みのソリューションだ。各サブモデルでは、ハードウェアの電力と速度の限界と精度・遅延とのトレードオフ関係に基づき、最適なサブモデルを選択する仕組みとなっている。(例えばスマートフォンの場合では、バッテリーや速度、遅延等のトレードオフの最適解に基づいてサブモデルが選択される)。

「Progressive Shrinking」アルゴリズムでは、サブモデル単体の学習効率性をサポートする用途として用いられる。最初に全体のモデルを学習し、続けて学習した全体モデルを同時に利用しながらサブモデルの学習に取り掛かる。最終的には、全てのサブモデルの学習が完了し各プラットフォームに基づいたスピーディーな対応が可能となる。

実験では、1000万以上のアーキテクチャモデルのコンピュータービジョンへのトレーニングは、各サブネットワークに対して費やす時間をはるかに効率性の面で上回ったという。また、このアプローチではモデルの制度並びに効率は失われず、比較して1.5倍から2.6倍の速度を計測したとしている。

現時点においてGitHub上で利用可能なのは、Samsung Galaxy Note8、Samsung Galaxy Note10、Samsung Galaxy S7 Edge、LG G8、Google Pixel、Pixel 2などのデバイスだ。どのデバイスでもIntel XenonやNvidaのGTX 1080Ti、Jetson TX2、V100に対応している。

MITは2017年の論文「Efficient Processing of Deep Neural Networks: A Tutorial and Survey」で既に今回の趣旨と重なる内容を発表していたことは触れておくべきだろう。同研究では、ハードウェア設計変更、コラボレーションやアルゴリズムの変更などAIモデルの計算不可を軽減する方法が複数示されていた。加えて、業界を通したエネルギー消費の分析や機械学習プロジェクトにおけるワット当たりの計算量の標準化の必要性が唱えられていた。

【via Venture Beat】

【原文】

----------[AD]----------

Microsoftが「バグの順位付けAI」開発、数カ月内にオープンソースとして公開へ

SHARE:

Microsoftは、同社に対し顧客から報告されるソフトウェアバグを、セキュリティー・非セキュリティーの括りにて99%の確率で正確に区別し、クリティカルで重要度の高いセキュリティーバグについては平均して97%の成功確率で順位付け可能なシステムを開発した。同システムは数カ月の内に、GitHub上にてオープンソース化されるという。 システムは、AzureDevOpsならびにGitHubレポジトリに保存…

Capture
Microsoft
Image Credit: Khari Johnson / VentureBeat

Microsoftは、同社に対し顧客から報告されるソフトウェアバグを、セキュリティー・非セキュリティーの括りにて99%の確率で正確に区別し、クリティカルで重要度の高いセキュリティーバグについては平均して97%の成功確率で順位付け可能なシステムを開発した。同システムは数カ月の内に、GitHub上にてオープンソース化されるという。

システムは、AzureDevOpsならびにGitHubレポジトリに保存される同社4万7000人のデベロッパー1300万件の作業物・バグデータセットを活用し開発された。Coralogixによれば、開発者は平均して1000行のコード辺り70個のバグを生み出すとしており、バグの修正には1行のコードを書くより30倍の労力を要するとしている。

同社によれば、モデル構築に際しセキュリティーの専門家が承認したトレーニングデータを使用し、統計的サンプリングに基づいてデータのレビューを実施したという。その後、データは「特徴量ベクトル」にエンコードされ、2段階のプロセスを経てシステムの設計が取り組まれる。その後、システムに対しデータがセキュリティーに対しクリティカルかどうかの判断を下すことが出来るよう学習させる。続けて、セキュリティーバグの場合には重要度のラベリングを可能とする学習が施された。

Microsoftが今回開発したモデルでは、バグ予想のために2つの技術を活用している。1つ目がTF-IDF(term frequency-inverse document frequency algorithm)だ。データ内における単語に対し重要度を振りわけ、全体の中でどれだけ関連性があるかを見極めるアプローチとなる。2つ目がロジスティック回帰モデルで、クラスやイベントが発生する確率をロジスティックス関数を基に算出する手法だ。

ソフトウェアにおけるバグを取り除くために、機械学習を使用しているのは同社だけではない。AmazonのCideGuruでは、社内開発のコードレビューやアプリに対して部分的学習を施し、漏洩や無駄なCPUサイクルの過多を発見するために利用されている。Facebookでは、エンジニアの手に届く前にバグ修正を生成するSapFixや、コードの動作と機能をマッピングし、潜在的なバグを探し出すZoncolanと呼ばれるツールが利用されている。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

AIで大学授業に類似したオンライン学習を発見せよ!ーーCourseraがロックダウン対策に乗り出す

SHARE:

オンライン学習スタートアップのCourseraは本日(原文掲載日は4月16日)、大学のコース科目と、Coursera上で提供される学習コンテンツのデータを照合するAIツール「CourseMatch」を発表した。Courseraによれば、同サービスは3月初旬に始まった同社のコロナウイルス対策構想の一部であるという。ロックダウン政策の影響を受け閉鎖を余儀なくされた大学が、授業をCousera上に移行で…

coursera-social-logo
Image Credit : Cousera

オンライン学習スタートアップのCourseraは本日(原文掲載日は4月16日)、大学のコース科目と、Coursera上で提供される学習コンテンツのデータを照合するAIツール「CourseMatch」を発表した。Courseraによれば、同サービスは3月初旬に始まった同社のコロナウイルス対策構想の一部であるという。ロックダウン政策の影響を受け閉鎖を余儀なくされた大学が、授業をCousera上に移行できるようにすることで、学習促進をサポートすることを目的としているという。

Courseraのデータサイエンス担当副社長Emily Glassberg Sands氏とデータサイエンティストのMarianne Sorba氏は以下のように述べている。

同プラットフォームを活用する大学は、彼らが提供していた学科コースに最も類似したCousera上の授業コンテンツの特定を簡易化できるツールを必要としています。これは何千もの大学及び何百万ものキャンパス内コースに共通する課題でした。2週間前、Courseraのデータサイエンスチームは、人的なキュレーションに頼らない、教授達が素早く学習をオンライン化できるソリューション「CourseMatch」の開発に取り組み始めました。

3月25日時点で、9万1,000校以上の公立・私立学校が閉鎖され、5,000万人以上の生徒が影響を受けているという。これらの学校の多くは、異なる学習レベルの生徒に対し、どのような形で授業を提供するかという点などに関して強く悩まされているが、CourseraはCourseMatch がこの問題を解決できると考えている。

CourseMatchは、英語または50以上の言語(翻訳と字幕)のコースのデータを取得する。自然言語処理技術と学習済みの埋め込みワード(語彙から実数までを含む)を活用し、大学の授業コースに最も類似したCourseraの学習コースを見つけ出す設計だ。大学のコース及び授業については、アルゴリズムは一般に公開されているコース名や説明文に加え、より具体的にはシラバスや学習目標などの情報も収集する。一方でCoursera上のコースでは、コースのタイトルや説明文、講義の成績表、課題、評価など、総合的に資料の情報を集めるという。

ある大学内のコースに対して、CourseMatchは、最も関連性の高い Courseraコースを、類似度を表す標準化されたスコアと共に最大5つまで表示する。CourseraによるとCourseMatchは既に、米国のJohnson C. Smith大学とBrown 大学、スペインの IESE、インドのACITEなどを含む1,800校の260万以上のカリキュラムを、Cousera上の何らかのコースにマッチングさせているという。

Glassberg Sands氏とSorba氏は以下のようにコメントを続ける

私たちの目標は、世界中の全ての大学による、迅速かつ簡単なオンライン化を支援することです。今後はフィードバックに基づいて、CouseraMatchの機械学習モデルを改良していくつもりです。世界中の教育機関に同ソリューションを試してみてほしいと考えています。

CourseMatchはCourseraの既存のCoursera for Campusツールをベースにしており、パートナーではない大学でもCourseraのコンテンツを利用して学習を補完できるように設計されている。一方でCoursera for Campusプログラムに登録した大学は、学内の学生、教職員、スタッフに対し、3,600 以上のプログラムを提供することが可能だ。

同サービス内では、工学やビジネス、データサイエンス、法律、健康、芸術、デザインなどの分野で利用できる。大学はこれらの分野は全てそのまま提供することもできるが、Coursera上の別のコンテンツと交換し提供することも可能だ。(もしくは、大学自身で作成したコースと交換することもできる)。

Coursera for Campusの顧客企業は、Course ProgressやSkill Indexなどの分析ダッシュボードや、実習課題用のCoursera Labsなどを含む、Courseraのオンライン評価ツール及びコンテンツ作成ツールを利用することもできる。教授及び教職員は、学生や卒業生を対象としたプライベートレッスン、ハンズオン・プロジェクト、評価、コースを公開することが可能だ。

Courseraによると、3月12日以降、3,000以上の大学及びコミュニティ・カレッジがCoursera for Campusプログラムを利用しているという。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

Google、AIで「男女別翻訳」に対応

SHARE:

Googleは4月22日、文法上の男女別に翻訳する機能を英語からスペイン語、そしてフィンランド語・ハンガリー語・ペルシャ語から英語へのGoogle翻訳においてリリースすることを発表した。新しいパラダイムを活用して翻訳結果を性別に対応した文章に修正することにより、ジェンダーバイアスの問題に対処する。 同社は、すでにトルコ語から英語への男女別翻訳を提供していたが、その根幹となる技術は主にジェンダー中立…

Google via Flickr by YsfYlmz

Googleは4月22日、文法上の男女別に翻訳する機能を英語からスペイン語、そしてフィンランド語・ハンガリー語・ペルシャ語から英語へのGoogle翻訳においてリリースすることを発表した。新しいパラダイムを活用して翻訳結果を性別に対応した文章に修正することにより、ジェンダーバイアスの問題に対処する。

同社は、すでにトルコ語から英語への男女別翻訳を提供していたが、その根幹となる技術は主にジェンダー中立かどうかをデータ集約的に検出する仕組みであった。今回のアプローチはそうではないため、よりスケーラブルだとしている。Google ResearchのシニアソフトウェアエンジニアであるMelvin Johnson氏はこう述べている。

男女別翻訳の質を高め、さらに4つの言語ペアに拡張することで、初めにローンチしたものよりも格段に進化しました。ジェンダーバイアスにさらに取り組んでいくことを約束し、ドキュメントレベルの翻訳にも拡大する予定です。

Johnson氏の説明によると、トルコ語から英語への男女別翻訳に使用されていた従来の分類子は、新しい言語に適応するのに手こずり、ニューラル機械翻訳(NMT)システムを使用して男女別翻訳を個別に出力することができなかったという。さらに、適格なクエリに対して男女別翻訳を表示することができなかった割合は最大40%だった。これは、男女別翻訳結果が、ジェンダーに関する部分以外でも一致しないことが多いからだ。

対照的に、新しいリライトベースの手法では、まず翻訳を生成し、次にそれらをレビューして、ジェンダー中立のソースフレーズからジェンダー固有の翻訳を生み出すインスタンスを特定。それが正しければ、センテンスレベルのリライターがもう片方の性の翻訳文を出力する。最後に、初めの翻訳文とリライトされた翻訳文をレビューし、違いがジェンダーだけであることを確認する。

Googleによると、このリライターは男性形・女性形のフレーズのペアからなるトレーニング用の例文を数百万件使用して構築された。Google翻訳チームは、一言語の膨大なデータセットに対し、性の区別のある代名詞を男性形から女性形(またはその逆)に交換することでリライト候補文を用意した。エンジニアが開発した言語モデルを数百万件の英文でトレーニング。コーパスから、男性形のインプットから女性形のアウトプット、またはその逆のトレーニングデータを抽出した。

双方向のトレーニングデータをマージしたものを使って、1層のTransformerベースのシーケンス間モデルをトレーニングした。次に句読点や大文字・小文字のバリエーションをつけたトレーニングデータでモデルの堅牢性を高め、最終的に男性形または女性形へのリライトを99%の割合で確実に生成できるようになった。

Johnson氏によると、Googleが開発したバイアスリダクションという測定基準で新旧の翻訳システムのバイアス減少率を測定したところ(ここでいう「バイアス」とは、ソースには男女の区別がないのに翻訳結果にはどちらか一方の性が選択されてしまうことを指す)、ハンガリー語、フィンランド語、ペルシャ語から英語への翻訳においてバイアスが90%以上減少。トルコ語から英語への翻訳については60%から95%に改善された。性別の正確性(性別を指定した場合に正しい男女別で翻訳できる割合)は平均97%だった。

改良版のGoogle翻訳システムは、同社がCloud Vision APIから人々の画像を「男性」「女性」とラベル付けする機能を削除してから数カ月後にロールアウトされる。これとは別に、2018年1月、GoogleはGmailの文章を自動的に補完する機能、Smart Composeにおいても推定される性別に基づいた男女別代名詞を使うことを中止している。

翻訳やコンピュータビジョンへのジェンダー中立なアプローチは、AIシステムから偏見をなくすためにGoogleが行っている大規模な取り組みのほんの一部だ。マウンテンビューに本社を置く同社では、AI倫理チームが開発したテストでバイアスを割り出し、予測技術から暴言、人種差別、ライバル会社への中傷や悲劇的な出来事への言及を取り除いている。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

Amazon Alexa、より自然な口調でテキストを読み上げられるように

SHARE:

Amazonは4月16日、サードパーティが提供するAlexaスキル(音声アプリなど)のニュースや音楽コンテンツ向けに、長文用の口調スタイルを発表した。ウェブページや記事、ポッドキャスト、ゲームのストーリーなどといった多様なテキスト情報に対応しており、米国の開発者は今週(4月第3週)から利用開始できる。 テキストをより自然に読み上げ、ユーザのエンゲージメントを上げることで体験の向上が見込まれる。加え…

Amazon Echo Dot Clock
Image Credit: Khari Johnson / VentureBeat

Amazonは4月16日、サードパーティが提供するAlexaスキル(音声アプリなど)のニュースや音楽コンテンツ向けに、長文用の口調スタイルを発表した。ウェブページや記事、ポッドキャスト、ゲームのストーリーなどといった多様なテキスト情報に対応しており、米国の開発者は今週(4月第3週)から利用開始できる。

テキストをより自然に読み上げ、ユーザのエンゲージメントを上げることで体験の向上が見込まれる。加えて、プロの声優を雇う必要がないので開発者にとってはコスト削減になり、スタジオでレコーディングするよりも時間の節約になる。

Amazonによると、この長文用の口調スタイルは、AIによるテキスト読み上げモデルを採用しており、段落と段落、セリフとセリフのあいだに自然な間が組み込まれている。同様に、Googleアシスタントにも最近、webサイトやAndroidアプリ内でより自然で人間らしい音声で長文コンテンツを読み上げる機能がローンチされた。

聞いてみてほしい。(編集部注:音声データは原文サイトをご確認ください)

【音声1】

こちらがAlexaのデフォルトスタイルだ。

【音声2】

長文用の口調スタイル以外にも、開発者はAmazon Pollyのニュース読み上げ・会話スタイルを利用することができる。Amazon PollyはAmazonのクラウドサービスの1つで、テキストを生き生きとした音声に変換するサービスだ。Alexaスキルの言語は29カ国語に対応しており、声質はMatthew、Joanna、Lupeから選ぶことができる。ニューススタイルはまるでテレビのアナウンサーやラジオのパーソナリティが話しているかのように聞こえる。会話スタイルの場合は堅苦しさがなく、あたかも友達や家族と話しているかのようだ。

昨年、AmazonはAIによって生成された音声に関する詳細な研究論文を発表した。声優が身に付けるには数十時間はかかるであろう口調スタイルを、わずか数時間のトレーニングで習得することができるシステムについて述べている。同社のモデルは、一連の音素をスペクトログラムに変換する生成系ニューラルネットワークからなり、時間軸に沿って変化する音声周波数のスペクトラムを視覚的に表現する。そうしたスペクトログラムを連続的なオーディオ信号に変換するボコーダもついている。

ひいては、AIモデルによって、大量のニュートラルな話し方の音声データと特定の話し方による数時間程度の音声データを結びつけるトレーニング方法を生み出し、口調スタイルとは無関係な要素と固有な要素の両方を識別できるAIシステムを開発している。Amazonはこれを利用してAlexa用の新ボイスやAmazon Pollyで多言語に渡る開発者向けボイスを制作している。

最後に、Amazonによると、Alexa用音声アプリの開発者は、アメリカ英語、アメリカスペイン語、カナダフランス語、ブラジルポルトガル語など、6つの言語による10種類の音声をAmazon Pollyから追加で使用することができる。

これらの開発に先立ち、AmazonはAlexaスキル用の口調として「うれしい・わくわくする」、「がっかり・同情」、短めのニューススタイル、音楽スタイルをリリース。11月にはブログで、感情をもたせた音声によってAlexaの標準音声よりも顧客満足度が30%上昇し、ニューススタイルおよび音楽スタイルについては自然度がそれぞれ31%、84%上昇したとしている。

Amazonは最近、AIを駆使して特注の話者を生成するAmazon Pollyの機能、「Brand Voices」もローンチした。このサービスでは顧客と社内エンジニアが協同して特定のペルソナを表す音声をAIで作り上げる。たとえばカナダのKFCには南米なまりの口調、ナショナルオーストラリア銀行にはオーストラリア英語といった具合だ。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------