Kyle Wiggers

Kyle Wiggers

テクノロジージャーナリスト。VentureBeat では主に AI の話題を担当。

執筆記事

Metaが進める「AIによる読唇術」メタバースのアバターにも活用可能な技術(2)

SHARE:

潜在的な欠点 (前回からのつづき)AV-HuBERTは、複雑なタスクのための教師なしマルチモーダル技術に対するMetaの投資の拡大を象徴している。同社は最近、Few-Shot Learnerと呼ばれるプラットフォーム上の有害コンテンツに取り組むための新たなマルチモーダルシステムを提案し、ラベルのないデータから音声認識、画像分割、テキストのスタイルコピー、オブジェクト認識を学習するモデルをリリースし…

Image Credit : Meta / Horizon Worlds

潜在的な欠点

(前回からのつづき)AV-HuBERTは、複雑なタスクのための教師なしマルチモーダル技術に対するMetaの投資の拡大を象徴している。同社は最近、Few-Shot Learnerと呼ばれるプラットフォーム上の有害コンテンツに取り組むための新たなマルチモーダルシステムを提案し、ラベルのないデータから音声認識画像分割テキストのスタイルコピー、オブジェクト認識を学習するモデルをリリースした。教師ありのシステムとは対照的に、教師なしのシステムはより柔軟で安価に導入することができる。ラベル付きデータセットのラベルは人間のアノテーターが一つ一つ丹念に追加する必要があるからだ。

AV-HuBERTは、学習に必要なラベル付きデータが少ないため、ニジェール・コンゴ語族のスス語のような「低リソース」言語の会話モデル開発の可能性を開くとMetaは主張している。また、AV-HuBERTは、音声障害者のための音声認識システムの構築や、ディープフェイクの検出、仮想現実アバター用のリアルな唇の動きの生成にも有用であると同社は提案している。

しかし、ワシントン大学のAI倫理学者であるOs Keyes氏は、AV-HuBERTには階級や障害にまつわる限界がつきまとうと懸念を表明している。電子メールのインタビューでVentureBeatに次のように指摘した。

「唇と歯の動きから人のスピーチパターンを評価するのであれば、例えば障害の結果、顔のスピーチパターンが歪んでいる人はどうするつもりなのでしょうか。耳が聞こえない方に対して不正確となる可能性の高い音声認識用のソフトウェアを作ろうとするのは、なんとも皮肉なことです」。

Microsoftとカーネギーメロン大学は論文で、AIにおける公平性に向けた研究ロードマップを提案しているのだが、ここで共著者達は、AV-HuBERTに似た顔面分析システムの側面が、ダウン症や軟骨形成不全(骨の成長が損なわれる病気)、特徴ある顔の違いをもたらす他の状態 の人々にはうまく機能しないかもしれないと指摘しているのだ。そのようなシステムは、脳卒中を患った人、パーキンソン病、ベル麻痺、自閉症、ウィリアムズ症候群の人たちも同様に失敗するかもしれないと、研究者は指摘している。つまり、彼らは、神経型人間と同じ顔の表情を使わない(あるいは使えない)かもしれないのだ。開発を主導するMohamed氏はこの点についてメールで、AV-HuBERTは唇の動きにのみ着目し、顔全体ではなく唇の動きを捉えていることを強調した。そして多くのAIモデルと同様に、AV-HuBERTの性能は「学習データ中の異なる集団の代表的なサンプルの数に比例する」と付け加えている。

「我々のアプローチの評価には、オックスフォード大学の研究者が2018年に一般公開したTED Talkの動画からなる、一般公開されているLRS3データセットを使用しました。このデータセットには障害を持つ話し手が含まれていないため、予想される性能劣化の具体的な割合はわかりません。しかし、今回新たに提案する技術は、トレーニングデータセットにおける現在の話者分布に制限されるものではありません。より広範で多様な集団をカバーする別のトレーニングデータセットがあれば、かなりの性能向上をもたらすと予測しています」(Mohamed氏)。

Metaは「背景の雑音や話者の重複が当たり前の日常的なシナリオにおいて、オーディオビジュアル音声認識モデルを改善するアプローチのベンチマークとして開発を続ける」と語る。この先、AV-HuBERT(Metaは製品化する予定はないとしている)を英語以外の多言語ベンチマークに拡張する予定だ。

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

メンバーシップ「BRIDGE Members」に参加するとBRIDGEがお届けするスタートアップ・トレンドをまとめたメンバー向けマガジンコンテンツ「Canvas」を購読いただけます。一度に情報をキャッチアップしたい人や、BRIDGE Tokyoなどのコンテンツをチェックしたい方にお届け中です。
  • BRIDGE Canvasの購読
  • メンバー向けDiscordご招待
  • BRIDGE Tokyoなどイベントご招待
無料メンバー登録


Metaが進める「AIによる読唇術」その方法とは(1)

SHARE:

人は音声を聞き取ることと、話し手の唇の動きを見ることの両方によって音声を認識する。実際、言語学習において視覚的な手がかりが重要な役割を担っているという研究結果もある。一方、AIの音声認識システムはほとんど、あるいは完全に音声に基づいて構築されている。そのため、学習には数万時間にも及ぶ膨大なデータが必要だ。 Meta社(旧:Facebook社)の研究者は、ビジュアル(特に口の動きの映像)が音声認識シ…

Photo by Christina Morillo from Pexels

人は音声を聞き取ることと、話し手の唇の動きを見ることの両方によって音声を認識する。実際、言語学習において視覚的な手がかりが重要な役割を担っているという研究結果もある。一方、AIの音声認識システムはほとんど、あるいは完全に音声に基づいて構築されている。そのため、学習には数万時間にも及ぶ膨大なデータが必要だ。

Meta社(旧:Facebook社)の研究者は、ビジュアル(特に口の動きの映像)が音声認識システムの性能を向上させることができるかどうかを調べるために、人が話すのを見て聞くことによって音声を理解するように学習するフレームワーク、Audio-Visual Hidden Unit BERT(AV-HuBERT) を開発した。Meta社は、AV-HuBERTが同じ量の書き起こしを使用する最高の視聴覚音声認識システムよりも75%精度が高いと主張している。さらにAV-HuBERTは、ラベル付けされたデータの10分の1を使用して、かつての最高水準の視聴覚音声認識システムを凌駕しており、音声データの少ない言語にも有効な可能性があるとしている。Meta AI研究者のAbdelrahman Mohamed氏は、VentureBeatのインタビューで次のように答えている。

「将来的にAV-HuBERTのようなAIフレームワークは、騒がしい日常の状況、例えばパーティーでのやりとりや賑やかなストリートマーケットでの音声認識技術の性能向上に利用できるかもしれない。そしてスマートフォン、拡張現実メガネ、カメラを搭載したスマートスピーカー(例:Alexa Echo Show)のアシスタントもこの技術の恩恵を受けることができるだろう」。

AV-HuBERT

読唇術の問題にAIを応用したのはMetaが初めてではない。2016年、オックスフォード大学の研究者たちは、特定のテストにおいて経験豊富な読唇術者の約2倍の精度を持ち、ほぼリアルタイムで映像を処理できるシステムを作り上げた。そして2017年、Alphabet傘下のDeepMindは数千時間に及ぶテレビ番組でシステムを訓練し、テストセットで約50%の単語を誤りなく正しく翻訳し、人間の専門家の12.4%をはるかに上回るという結果を得た。

しかしオックスフォード大学とDeepMindのモデルは、その後の多くの読唇術モデルと同様、認識できる語彙の範囲に限界があった。また、このモデルは学習するためにトランスクリプトと対になったデータセットを必要とし、動画内の話者の音声を処理することができなかったのだ。

そこでAV-HuBERTは、ややユニークなことに、教師なし学習、つまり自己教師あり学習を活用している。教師あり学習では、DeepMindのようなアルゴリズムは、例と特定の出力の間の基本的な関係を検出できるようになるまで、ラベル付けされた例データで訓練される。例えば、コーギーの写真(例)を見せられたら、「犬」という単語(出力)を書くようにシステムを学習させることができる。しかし、AV-HuBERTは、ラベルのないデータを分類することを学習する。つまり、データを処理してその固有の構造から学習する。

AV-HuBERTは音声と唇の動きを手がかりに言語を学習するという意味でも、マルチモーダルである。Metaは会話中の唇や歯の動きなどの手がかりを聴覚情報と組み合わせることで、AV-HuBERTに2つのデータタイプの間の「微妙な関連性」を捉えることができると述べている。

AV-HuBERTの初期モデルは、ラベル付けされた英語のTED Talkビデオを30時間かけて学習したもので、従来の最先端モデルの学習時間である3万1,000時間よりも大幅に少なくなっている。しかし、音声認識性能の指標である単語誤り率(WER)は、より少ないデータで学習したにもかかわらず、話し手が見えても聞こえない場合、旧モデルの33.6%に対してAV-HuBERTは32.5%とわずかに改善された程度に留まった(WERとは誤認識した単語数を単語数で割ったもので、32.5%は約30単語に1個の割合で誤認識していることになる)。さらに433時間分のTED Talksを学習させると、AV-HuBERTのWERは28.6%に低下した。

AV-HuBERTがデータ間の構造と相関を十分に学習した後、研究者はラベルのないデータでさらに学習させることができたとしている。YouTubeにアップロードされた2,442時間分の有名人の英語動画である。これにより、WERは26.9%まで低下しただけでなく、特定の用途(複数人が同時に発言する場合など)や異なる言語に対するフレームワークの学習には、少量のラベル付きデータで済むことが実証されたとMetaは述べている。

実際にMetaは、AV-HuBERTがバックグラウンドで大きな音楽やノイズが流れているときに人のスピーチを認識する際に、音声のみのモデルよりも約50%優れていると主張している。また、音声と背景のノイズが同じ大きさの場合、AV-HuBERTは3.2%のWERを達成し、従来の最高のマルチモーダルモデルの25.5%を下回っている。(次につづく)

 

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

メンバーシップ「BRIDGE Members」に参加するとBRIDGEがお届けするスタートアップ・トレンドをまとめたメンバー向けマガジンコンテンツ「Canvas」を購読いただけます。一度に情報をキャッチアップしたい人や、BRIDGE Tokyoなどのコンテンツをチェックしたい方にお届け中です。
  • BRIDGE Canvasの購読
  • メンバー向けDiscordご招待
  • BRIDGE Tokyoなどイベントご招待
無料メンバー登録


成長続けるロボット管理市場「Formant」1800万ドル調達(2)

SHARE:

(前回からのつづき) Linnell氏は本誌VentureBeatの取材に対し「パンデミックによる労働力不足はロボット工学の世界に多くの注目を集めました。そして、現在では労働力不足に悩む、退屈で汚く危険な仕事にロボットが取り組んでいます」とメールで 次のように回答してくれている。 「Formant はデバイスからのすべての重要なデータ(カメラの映像、位置、ステータスなど)をストリームし、リアルタイ…

(前回からのつづき)

Linnell氏は本誌VentureBeatの取材に対し「パンデミックによる労働力不足はロボット工学の世界に多くの注目を集めました。そして、現在では労働力不足に悩む、退屈で汚く危険な仕事にロボットが取り組んでいます」とメールで 次のように回答してくれている。

「Formant はデバイスからのすべての重要なデータ(カメラの映像、位置、ステータスなど)をストリームし、リアルタイムまたは履歴として見ることができる「データの DVR」を実現することで、個々のロボットの行動を顧客に提供します。また何か問題があれば、オペレーターがロボットをリモートで操作できるようにしています。さらに利害関係者はパフォーマンスを分析し、ロボットのパフォーマンスをビジネス目標に関連付けるために、フリートデータのハイレベルな可視化も実現しているのです」。

Formantはまた、インターネット接続があれば、世界のどこからでもロボットを制御することができる。そしてFormantのレポート作成ツールは、分析やトレンド(技術的な不具合、バッテリー寿命、走行距離、センサー温度など)を関係者向けにエクスポート可能な1枚のページにまとめることができる。

成長する市場

Linnell氏によると、200種類以上のロボットをサポートするFormantのプラットフォームは、毎月5万件のライブビデオストリームと50億件のデータポイントを処理しているとのことだ。現在の顧客にはフォーチュン100社や、BP、Canvas、Diligent、Graze、Burroなどの初期段階のロボット工学スタートアップ企業、John Deere子会社のBlue Riverが含まれており、同社では畑で農作業ロボットが生成するデータの取得にFormantを活用している。

BurroのCEO兼創業者のCharlie Andersen氏はプレスリリースで「Formantは私たちのロボット操業を拡大するために非常に重要なものでした。私たちの顧客は5,000台のロボットを自分の畑で走らせ、それを部屋の中でスクリーンで見たいと考えている」とコメントしている。

Formantは、倉庫や工場でロボットを指揮するソフトウェアを提供するSVT Roboticsと競合している。この分野の大手企業であるBrain Corpは、フルフィルメントセンター、空港、小売環境で稼働するロボット向けに同等のオーケストレーション・プラットフォームを提供している。Amazonは最近、AWS IoT RoboRunnerを発表した。これは、Amazon Web Serviceを通じて利用できるロボティクスサービスで、ロボットの一群が共同で作業できるようにするアプリケーションを企業が容易く構築できるように設計されたサービスだ。

Linnell氏によると従業員20人のFormantは、2022年には規模が倍増する勢いだそうだ。この最新の投資ラウンドには、Hillsven、Pelion、Goodyear Ventures、Thursday Ventures、Ericsson、Picus Capital、Holman Strategic Venturesらが参加しており、「増え続ける顧客とパートナーにより良いサービスを提供できるようにする」と彼は最後にこう付け加えた。

「今回の資金調達は主に市場参入チームと、カスタマーサポートおよびサクセスチームの増強に充てられます。製品面ではFormantの拡張性を確保し、顧客が簡単にアプリケーションやワークフローを我々のプラットフォーム内で構築できるよう、統合やAPIに大きな投資を行う予定です」。

Formantの総資本は現在2300万ドルだ。

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

メンバーシップ「BRIDGE Members」に参加するとBRIDGEがお届けするスタートアップ・トレンドをまとめたメンバー向けマガジンコンテンツ「Canvas」を購読いただけます。一度に情報をキャッチアップしたい人や、BRIDGE Tokyoなどのコンテンツをチェックしたい方にお届け中です。
  • BRIDGE Canvasの購読
  • メンバー向けDiscordご招待
  • BRIDGE Tokyoなどイベントご招待
無料メンバー登録


企業のロボットをまとめて管理するツール「Formant」1800万ドル調達(1)

SHARE:

ロボット産業は企業が組織全体のプロセス自動化を目指す中、成長を続けている。McKinseyによると、88%の企業が今後数カ月のうちにロボティクスによる自動化を自社のインフラに折り込むことを計画しているとのことだ。また北米に拠点を置く企業は、2020年に31万台以上のロボティクスシステムを発注し、業界の収益は推定15億ドル超となるなど、この分野が好調であることを証明している。 一方、ロボットが人間の…

ロボット産業は企業が組織全体のプロセス自動化を目指す中、成長を続けている。McKinseyによると、88%の企業が今後数カ月のうちにロボティクスによる自動化を自社のインフラに折り込むことを計画しているとのことだ。また北米に拠点を置く企業は、2020年に31万台以上のロボティクスシステムを発注し、業界の収益は推定15億ドル超となるなど、この分野が好調であることを証明している。

一方、ロボットが人間の仕事の一部を代替するのではないかという懸念がある。

最近のMITの研究によると、ロボットが労働力に加わるごとに3.3人分の仕事を代替する効果があり、オックスフォード・エコノミクスは、2030年までにロボットが2000万件の製造業の仕事を代替すると予想している。ただ、ロボットは複雑な問題を解決するために人間と一緒に働くことも可能であり、現在もそうなっている。Loup Ventures社のレポートによると、2025年までに販売されるロボットの34%は協働型で、「協働型ロボティクス市場の売上は2020年までに10億ドルに急増すると予測している

協働型であろうとなかろうと、ロボットのオーケストレーションには、エンジニアだけでなく、ロボットを導入する企業の経営者が意思決定できるツールが必要だ。Formantは、Google、Savioke、Redwood Roboticsの元ソフトウェアエンジニア、ロボティシャン、プロダクトマネージャーによって設立された新興企業で、大規模なロボット群を管理するためのクラウドベースのプラットフォームを開発するサプライヤーだ。Formantは本日(原文掲載日は1月5日)、SignalFireが主導するシリーズAラウンドで1800万ドルを調達したと発表しており、そのソリューションにより、企業は遠隔地を含むほぼどこからでもロボットの操作、監視、分析を行うことができるとしている。

ロボットの管理

Formantの創業者であるJeff Linnell氏は、ロボット工学のキャリアの初期、企業がすべての機械や自律型デバイスを管理できるプラットフォームを必要としていると述べている。Linnell氏は以前、巨大な機械アームとカスタムソフトウェアを組み合わせた映画向けのブティックデザインスタジオ「Bot & Dolly」を共同設立していたが、2014年にGoogleに買収された。そして彼はグーグルのロボット部門の製品責任者を務めた後、オートメーションのベテランやエンジニアとチームを組み、Formantを設立した。

Above: With Formant, companies can monitor — and take control of — their robot fleets in real time.
Image Credit: Formant

「私たちはすぐに、すべてのロボティクス企業が特色あるものだと気がついたのです。そこでコア機能に加え、Formantの(製品を)拡張可能にするため、また、顧客がFormant内部で我々のデータやインフラを使ってカスタムアプリを構築できるようにするため、APIにも早くから投資しました」(Linnell氏)。

Formantは企業がロボットの一群を監視し、アラートを受信し、何か問題が発生したときに根本原因の分析に着手することを可能にする。このプラットフォームを利用することで、顧客は過去とライブの遠隔測定データを閲覧し、フリートオペレーターやビジネスアナリスト向けに安全性、効率性、パフォーマンス監視のダッシュボードを設定することができる。Formantは現場、顧客の地域、ハードウェアのバージョンなどの次元に沿ってデータの集計を実行し、目標を定義するのに役立つ。さらにこのソフトウェアでは、従業員が興味のあるタグを付けて共有したり、フィールドオペレーションチームと協力してビデオクリップなどの追加のデータフィードを取得し、アップロードすることができる。(次につづく)

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

メンバーシップ「BRIDGE Members」に参加するとBRIDGEがお届けするスタートアップ・トレンドをまとめたメンバー向けマガジンコンテンツ「Canvas」を購読いただけます。一度に情報をキャッチアップしたい人や、BRIDGE Tokyoなどのコンテンツをチェックしたい方にお届け中です。
  • BRIDGE Canvasの購読
  • メンバー向けDiscordご招待
  • BRIDGE Tokyoなどイベントご招待
無料メンバー登録


OKR管理プラットフォーム「Gtmhub」、1.2億米ドルをシリーズC調達——コロナ禍のリモートワーク増が追い風に

SHARE:

コロラド州デンバーを拠点に、目標と主な結果(OKR)のトラッキングプラットフォームを開発するスタートアップ Gtmhub は16日、Index Ventures がリードしたシリーズ C ラウンドで1億2,000万米ドルを調達した。このラウンドには、Visionaries Club、Insights Partners、Singular、CRV も参加した。今回の資金調達により、同社の累積調達額は1…

Image credit: Gtmhub

コロラド州デンバーを拠点に、目標と主な結果(OKR)のトラッキングプラットフォームを開発するスタートアップ Gtmhub は16日、Index Ventures がリードしたシリーズ C ラウンドで1億2,000万米ドルを調達した。このラウンドには、Visionaries Club、Insights Partners、Singular、CRV も参加した。今回の資金調達により、同社の累積調達額は1億6,100万米ドルを超えた。CEO の Ivan Osmak 氏は、雇用と製品拡大に投入される予定だと述べている。

Gtmhub は2015年、Osmak氏、Jordan Angelov 氏、Radoslav Georgiev 氏、Bo Pedersen 氏によって設立された。同社のソフトウェアはサービスとして提供され、マネージャーがチームを調整しながらOKRを作成するためのガイドを提供し、マイルストーンメーカーが到達すると関係者にアップデートされる。

Osmak 氏は VentureBeat にメールで次のように語った。

Gtmhub は、もともとデータ会社として設立され、その後、OKR の会社になりた。データは戦略に影響を与え、戦略はデータに影響を与える。Gtmhub を使えば、組織は、より速く仕事をし、機敏に行動し、より迅速に軌道修正する必要性に応えることができる。今回のラウンド(で調達した資金)は、規模拡大、市場浸透、予測・処方機能を含む製品提供の拡大に使用される予定だ。

OKR のトラッキング

OKR の開発は、一般に、インテル在職中にこの手法を導入した Andrew Grove 氏によるとされている。インテルの営業担当者であった John Doerr 氏がグーグルに OKR を紹介し、定着させた。現在、OKR は Amazon や Spotify などの企業で、目標や目的を定義し、その結果を追跡するために使用されている

OKR は、このデジタル時代においても企業に貢献し続けており、マッキンゼーは、OKR の慣行が「仕事をスピードアップさせた」と断言している。しかし、労働力が新型コロナウイルス感染拡大期よりもさらに分散化するにつれ、一部の企業は、従業員、部門、組織全体で目標に対する進捗を追跡することに苦労している。

Gtmhub の目標追跡クラウドダッシュボード
Image Credit: Gtmhub

Kaplan と Norton がまとめた統計によると、約90%の企業が包括的な目標設定戦略を策定していない。また、管理職の25%しか業務と目標達成を結びつけておらず、経営陣の85%が OKR 戦略について議論するのは月に1時間に過ぎない。

Gtmhub は、このような企業が複数のソースから1つのダッシュボードでパフォーマンスを監視するのを表向きに支援し、目標の共有、注釈、レビュー、サブゴールへのブレイクダウンを可能にする。このソフトウェアは、リーダーが OKR を公表する前にブレーンストーミングできるノートのようなコラボレーション環境を提供し、ユーザがタスクと OKR の間にリンクを作成できるツールやカスタムフィールドも提供する。

Gtmhub のユニークな特徴の一つは、RPA(ロボティック・プロセス・オートメーション)を利用していることで、顧客は OKR を大規模に展開・管理できる。RPA を導入することで、OKR の進捗を過去の値と比較したり、誰かが OKR に合わせたり、OKR の進捗に大幅な変化があった場合に自動的に管理者にアラートを出したりすることができる。

Gtmhub は、API と共通のファイル保存形式により、既存の多くの HR プラットフォームと連携できる。また、Gtmhub のパートナー企業が提供する OKR、インサイト(指標、表、グラフなど)、アドオンのマーケットプレイスに接続し、拡張性を確保する。

多くの企業はまだサイロ化されており、それぞれの役割と責任が組織の成功にどのように貢献しているかについてのコンテキストはほとんど無い。Gtmhub のプラットフォームは、アジリティ、透明性、コンテキストを回復させ、戦略と成果の間の橋渡しする。

Gtmhub のプラットフォームは、アジリティ、透明性、コンテクストを回復し、戦略と成果の間の橋渡しをする。企業はどこからでも人材を集めることができ、従業員は優先順位に沿い、アウトプットよりも結果に集中し、部門横断的なコラボレーションに従事し続けることができる。(Osmak 氏)

成長と課題

企業では、デジタルトランスフォーメーションは、しばしば成長の源泉となる一方で、新型コロナウイルス感染拡大期に特定の目標を達成するための障壁をもたらし続けている。最近の調査では、経営幹部の3分の1以上が、新型コロナウイルス感染拡大に関連するテクノロジーの問題のために、プロジェクトの期限を逃してしまったと報告している。一方、Great Place to Work によると、20%のエグゼクティブが、リモートワークがチームやビジネスユニットの生産性にさまざまな影響を与え、あるものは改善され、あるものは悪化していると回答している

Image Credit: Gtmhub

生産性の低下に対する懸念から、一部の雇用主は、従業員が仕事を続けられるように監視技術を導入している。ExpressVPN が雇用主を対象に行った調査では、78%がモニタリングソフトウェアを使用して、従業員のパフォーマンスやオンライン活動を追跡していることがわかった。当然のことながら、従業員の反応は概して悪く、ExpressVPN の調査では59%が、雇用主に監視された結果、ストレスや不安を感じたと答えている。

Gtmhub や WorkBoardAlly.ioJellyfishといった他の OKR トラッキングプラットフォームは、必ずしもこのカテゴリには属さない。しかし、Gtmhub のソフトウェアは、最高の達成度、OKR の進捗状況の統計、OKR  プロセスのデータ、タスクの詳細など、従業員レベルの指標を追跡している。

Gtmhub は、デフォルトで社員は顧客データにアクセスできず、顧客データは Gtmhub 社員のワークステーションやオフィス内のオンプレミスサーバでは処理されず、Microsoft Azure 上にのみ存在すると述べている(Gtmhub のソフトウェアは、Azure 上でホストされている)。

新型コロナウイルスの感染拡大は、従業員の働き方と働く場所を大きく変えた。つまり、より多くの企業が Gtmhub のプラットフォームを採用し、社員が社外で仕事をしている間の可視性を高め、成果、効率、効果に焦点を当てた。(Osmak 氏)

プライバシーに関する懸念はさておき、従業員240人の Gtmhub は、Adobe、TomTom、Red Hat、Experian など1,000以上の企業や政府機関の顧客を持ち、堅調な OKR ソフトウェア市場で成長する素地があると述べている。Verified Market Research によると、この分野は2028年までに18億4,000万米ドルに達する可能性があり、2020年の7億4,200万米ドルから CAGR(複合年間成長率)12.0%で成長している。Osmak 氏は、2021年末に前年比3倍の成長を遂げると予測している。

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

メンバーシップ「BRIDGE Members」に参加するとBRIDGEがお届けするスタートアップ・トレンドをまとめたメンバー向けマガジンコンテンツ「Canvas」を購読いただけます。一度に情報をキャッチアップしたい人や、BRIDGE Tokyoなどのコンテンツをチェックしたい方にお届け中です。
  • BRIDGE Canvasの購読
  • メンバー向けDiscordご招待
  • BRIDGE Tokyoなどイベントご招待
無料メンバー登録


Meta、AIモデルの不確実性を計測できる確率的プログラミングシステム「Bean Machine」をリリース

SHARE:

Meta(旧Facebook)は先頃、表向きは AI モデルにおける不確実性の表現と学習を容易にする確率的プログラミングシステム「Bean Machine」のリリースを発表した。Bean Machine は、初期ベータ版として提供されており、自動的な「不確実性を考慮した」学習アルゴリズムによって、モデルの観測されない特性を発見するために使用することができる。 Bean Machine を支える M…

Image credit: Meta

Meta(旧Facebook)は先頃、表向きは AI モデルにおける不確実性の表現と学習を容易にする確率的プログラミングシステム「Bean Machine」のリリースを発表した。Bean Machine は、初期ベータ版として提供されており、自動的な「不確実性を考慮した」学習アルゴリズムによって、モデルの観測されない特性を発見するために使用することができる。

Bean Machine を支える Meta の研究者はブログ投稿で次のように説明している。

Bean Machineは、確率分布を視覚化するための物理的な装置、つまり確率的システムの計算前の例から着想を得ています。

Bean Machine 開発チームの我々は、システムの使いやすさがその成功の基盤を形成すると信じており、PyTorch エコシステム内の宣言的哲学(declarative philosophy)を中心に Bean Machine の設計を行うように配慮している。

不確実性のモデリング

ディープラーニングのモデルは、たとえ間違いを犯したとしても、過信してしまうというのが一般的な理解だろう。認識論的不確実性(epistemic uncertainty)とは、学習データが適切でなかったためにモデルが知らないことを表すもので、一方、偶発的不確実性(aleatoric uncertainty)とは、観測の自然なランダム性から生じる不確実性を表すものである。十分な学習サンプルがあれば、エピステミックな不確実性は減少しますが、アレータリックな不確実性は、より多くのデータが提供されても減少することはあらない。

Bean Machine が採用している AI 技術である確率論的モデリング(probabilistic modeling)は、将来の結果の発生を予測する際に、ランダムな事象の影響を考慮することで、これらの不確実性を測定することができる。他の機械学習アプローチと比較して、確率論的モデリングは、不確実性の推定、表現力、解釈力などの利点を備えている。

これを活用するアナリストは、AI システムの予測だけでなく、他の可能性のある予測の相対的な可能性も理解することができる。また、確率的モデリングは、モデルの構造を問題の構造に一致させることを容易にする。また、特定の予測がなぜ行われたのかを解釈することができ、モデルの開発プロセスを支援することができる。

Bean Machine は、Metaの機械学習フレームワーク「PyTorch」とカスタム C++ バックエンド「Bean Machine Graph(BMG)」上に構築されており、データサイエンティストがモデルの計算を直接 Python で書き出し、BMG がモデルの宣言に基づいて予測値の可能な分布を推測する確率的モデリングの作業を行うことができる。

Bean Machine で測定される不確実性は、モデルの限界と潜在的な失敗点を明らかにするのに役立ちる。例えば、不確実性によって、住宅価格予測モデルの誤差や、新しいアプリの機能が古い機能よりも優れたパフォーマンスを発揮するかどうかを予測するために設計されたモデルの信頼度を明らかにすることができる。

不確実性の概念の重要性をさらに示すものとして、最近のハーバード大学の研究では、機械学習のバックグラウンドを持つ人とそうでない人の両方に不確実性の指標を示すと、AI 予測に対する回復力を等しくする効果があることがわかりた。AI への信頼を醸成することは、測定基準を提供するほど簡単ではないかもしれないが、落とし穴を意識することで、機械学習の限界から人々を守ることに一定の効果が期待できる。

Bean Machine は、確率分布の形で不確実性の信頼できる尺度を用いて…リッチなモデルをソースコードに直接エンコードするのは簡単で、(モデルは)ドメインと一致するので、モデル内の中間学習特性(intermediate learned properties)を問い合わせることができる。これは、モデルの作成であれ、学習戦略の高度な調整であれ、Bean Machine をシンプルかつ直感的に使えるようにするものだ。(Meta のブログ投稿)

Bean Machine は、12月上旬の時点で GitHub で公開されている

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

メンバーシップ「BRIDGE Members」に参加するとBRIDGEがお届けするスタートアップ・トレンドをまとめたメンバー向けマガジンコンテンツ「Canvas」を購読いただけます。一度に情報をキャッチアップしたい人や、BRIDGE Tokyoなどのコンテンツをチェックしたい方にお届け中です。
  • BRIDGE Canvasの購読
  • メンバー向けDiscordご招待
  • BRIDGE Tokyoなどイベントご招待
無料メンバー登録


テキストから実物そっくりの風景画像を作成、Nvidiaの最新AI「GauGAN2」の威力

SHARE:

Nvidiaは11月22日、GauGAN モデルの後継となる GauGAN2 という AI システムの詳細を発表した。これにより、ユーザーは実在しない実物そっくりの風景画像を作成することができる。GauGAN2 は、セグメンテーションマッピング、インペインティング、テキストから画像への生成などの技術を1つのツールにまとめ、言葉と絵が混在するフォトリアリスティックなアートを作成できるように設計されて…

Image credit: Nvidia

Nvidiaは11月22日、GauGAN モデルの後継となる GauGAN2 という AI システムの詳細を発表した。これにより、ユーザーは実在しない実物そっくりの風景画像を作成することができる。GauGAN2 は、セグメンテーションマッピング、インペインティング、テキストから画像への生成などの技術を1つのツールにまとめ、言葉と絵が混在するフォトリアリスティックなアートを作成できるように設計されている。

Nvidia のコーポレート・コミュニケーション・チームのメンバー Isha Salian 氏は、次のようにブログに書いている。

GauGAN2 のニューラルネットワークは、テキストから画像へ、あるいはセグメンテーションマップから画像へのアプリケーションに特化した最先端のモデルと比較して、より多様で高品質な画像を生成する。

ユーザは、想像したシーンのすべての要素を描き出す必要はなく、簡単なフレーズを入力するだけで、雪をかぶった山脈のような画像の主な特徴やテーマを素早く生成することができる。この出発点から、特定の山を高くしたり、前景に数本の木を加えたり、空に雲を加えたりと、スケッチでカスタマイズすることができる。

テキストから画像を生成

後期印象派の画家ポール・ゴーギャンの名になぞらえた GauGAN2 は、100万枚以上の Flickr の公開画像でトレーニングされた Nvidia の2019年の GauGAN システムを改良したものである。GauGAN2 は、GauGAN  と同様に、季節によって降水の種類が変わることなど、雪、木、水、花、茂み、丘、山といった対象物の関係性を理解している。

GauGANとGauGAN2は、生成器と識別器で構成されるGAN(Generative Adversarial Network)と呼ばれるシステムの一種だ。生成器は、画像とテキストの組み合わせなどのサンプルを受け取り、どのデータ(単語)が他のデータ(風景写真の要素)に対応するかを予測する。生成器は、識別器を欺くことで学習され、識別器は予測が現実的かどうかを評価する。GANの遷移は、最初は質が悪いが、識別器のフィードバックによって改善される。

GauGAN とは異なり、1,000万枚の画像で学習したGauGAN2は、自然言語による説明を風景画像に変換することができる。sunset at a beach」のようなフレーズを入力するとシーンが生成され、「sunset at a rocky beach」のような形容詞を加えたり、「sunset」を「afternoon」や「rainy day」に入れ替えたりすると、瞬時に画像が修正される。

GauGAN2 では、シーンの中のオブジェクトの位置を示す高レベルのアウトラインであるセグメンテーションマップを生成することができる。そこから描画に切り替え、「空」「木」「岩」「川」などのラベルを使ったラフスケッチでシーンを調整し、ツールのペイントブラシで画像に落とし込むことができる。

AIによるブレインストーミング

GauGAN2は、OpenAI の DALL-E  と同じように、テキストプロンプトに合わせて画像を生成することができる。GauGAN2 や DALL-E のようなシステムは、基本的には視覚的なアイデアを生み出すもので、映画、ソフトウェア、ビデオゲーム、製品、ファッション、インテリアデザインなどに応用できる可能性がある。

Nvidia は、GauGAN の最初のバージョンがすでに映画やビデオゲームのコンセプトアートの作成に使用されていると主張している。Nvidia は、GauGAN2のコードをGitHubで公開するとともに、Nvidia の AI およびディープラーニング研究のウェブハブである Playground  でインタラクティブなデモを公開する予定だ。

GauGAN2 のような生成モデルの欠点は、バイアスがかかる可能性があることだ。DALL-E の場合、OpenAI は CLIP という特殊なモデルを使用して、DALL-E が生成した1プロンプトあたり数百個のサンプルの中から上位のサンプルを浮上させて画像品質を向上させた。しかし、ある研究によると、CLIP は黒人の写真を高い確率で誤分類し、女性を「乳母」や「家政婦」などのステレオタイプな職業に関連付けていたという。

テキストから作成された風景画像
Image credit: Nvidia

Nvidia はプレス資料の中で、GauGAN2に偏りがないかどうかをどのように監査したのか、あるいは監査したかどうかについては言及を避けている。Nvidia の広報担当者はメールで説明した。

このモデルは1億個以上のパラメータを持ち、風景画像の独自のデータセットからトレーニング画像を取得して、1ヶ月以内にトレーニングを完了した。このモデルは風景にのみ焦点を当てており、トレーニング画像に人が写っていないかどうかを監査した…GauGAN2は単なる研究用のデモだ。

GauGAN は、実在しない人物の生き生きとした画像を生成できる「StyleGAN」などのディープフェイク技術を開発した Nvidia が提供する、現実を変える最新の AI ツールの1つだ。2018年9月、同社の研究者たちは、脳腫瘍の合成スキャンを工作できるシステムを学術論文に記載した。同年、Nvidia は、現実世界の映像を使って仮想環境を作ることができる生成モデルを詳述した。

GauGAN の登場に先立ち、GAN Paint Studio が公開された。これは、ユーザーが任意の写真をアップロードして、描かれた建物や植物、備品の外観を編集できる AI ツールだ。他にも、生成機械学習モデルを用いて、YouTube の動画を見て、自然言語のキャプションから画像や絵コンテを作成したり、人間の会話を含む音声クリップに顔の動きをアニメーションで同期させたりして、リアルな動画を作成している

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

メンバーシップ「BRIDGE Members」に参加するとBRIDGEがお届けするスタートアップ・トレンドをまとめたメンバー向けマガジンコンテンツ「Canvas」を購読いただけます。一度に情報をキャッチアップしたい人や、BRIDGE Tokyoなどのコンテンツをチェックしたい方にお届け中です。
  • BRIDGE Canvasの購読
  • メンバー向けDiscordご招待
  • BRIDGE Tokyoなどイベントご招待
無料メンバー登録


Amazon、多種複数のロボットの運用を支援する「AWS IoT RoboRunner」とロボット特化アクセラレータを発表

SHARE:

Amazon は、28日開催されたカンファレンス「Amazon Web Services(AWS)re:Invent 2021」の基調講演で、企業がロボット群を連携させるアプリケーションを簡単に構築・展開できるようにするための新しいロボットサービス「AWS IoT RoboRunner」を発表した。IoT RoboRunner と同時に、Amazon は、非営利団体 MassRobotics と共…

Image credit: Amazon Web Services

Amazon は、28日開催されたカンファレンス「Amazon Web Services(AWS)re:Invent 2021」の基調講演で、企業がロボット群を連携させるアプリケーションを簡単に構築・展開できるようにするための新しいロボットサービス「AWS IoT RoboRunner」を発表した。IoT RoboRunner と同時に、Amazon は、非営利団体 MassRobotics と共同で、自動化、ロボティクス、産業用 IoT(Internet of Things)技術の課題に取り組むインキュベータープログラム「AWS Robotics Startup Accelerator」を発表した。

新型コロナウイルス感染拡大の影響でデジタルトランスフォーメーションが促進される中、企業におけるロボティクス、そしてより広範な自動化の導入が加速している。Automation World の最新レポートによると、過去1年間にロボットを導入した企業の大部分は、人件費の削減、生産能力の向上、労働者不足の解消を目的としている。同調査によると、44.9%の企業が、組立・製造施設に設置されたロボットを日常業務に不可欠なものと考えている。

Amazon は、自身がロボット工学に多額の投資をしているが、2022年までに75億2,000万米ドル以上の規模になると予想されるロボットソフトウェア市場のより大きな部分を獲得する意図を、恥ずかしげもなく語っている。2018年には、AI や機械学習機能を備えたロボットアプリケーションの展開を開発者向けに支援する製品「AWS RoboMaker」を発表している。そして Amazon は今年初め、ロボティクスワークフローをオーケストレーションするためのサービス「RoboMaker」をサポートするツールキット「SageMaker Reinforcement Learning Kubeflow Components」を展開した

IoT RoboRunner

Image credit: Amazon Web Services

IoT RoboRunner は、Amazon の倉庫ですでに使用されているロボット管理技術をベースに開発されたもので、現在プレビュー版が公開されている。AWS の顧客は、ロボットと既存の自動化ソフトウェアを接続することで、オペレーション全体の作業をオーケストレーションすることができ、ロボット群の各タイプのロボットからのデータを組み合わせ、施設、場所、ロボットのタスクデータなどのデータタイプを中央のリポジトリで標準化することができる。

Amazon によると、IoT RoboRunner の目的は、ロボット群の管理アプリを構築するプロセスを簡素化することだ。企業が業務を自動化するためにロボットに頼ることが多くなるにつれ、企業はさまざまなタイプのロボットを選択するようになり、ロボットを効率的に編成することが難しくなっている。ロボットベンダーや作業管理システムは、それぞれ独自の制御ソフトウェア、データフォーマット、データリポジトリを持っており、互換性がないことが多いのだ。また、新しいロボットをフリートに追加する際には、制御ソフトウェアを作業管理システムに接続したり、管理アプリ用のロジックをプログラミングしたりする必要がある。

開発者は、IoT RoboRunner を使って、ロボット管理アプリの構築に必要なデータにアクセスしたり、あらかじめ用意されているソフトウェア・ライブラリを活用して、作業配分などのタスクのアプリを作成したりすることができる。さらに、IoT RoboRunner は、API を介してメトリクスや KPI を管理用ダッシュボードに配信することもできる。

IoT RoboRunner は、Freedom RoboticsExotec などのロボット管理システムと競合する。しかし、Amazon は、IoT RoboRunner が SageMaker、Greengrass、SiteWise といった AWS のサービスと連携されていることで、市場の競合に対して優位に立っていると主張している。

Amazon はブログで、次のように述べている。

AWS IoT RoboRunner を使用することで、ロボット開発者はロボットを個別に管理する必要がなくなり、集中管理によって施設全体のタスクをより効果的に自動化できるようになる。将来を考えると、より多くの企業がより多くの種類のロボットを追加することが予想される。それらすべてのロボットの力を活用することは複雑だが、私たちは、単一のシステムビューを通じてロボットを簡単に最適化することで、企業が自動化の価値を最大限に引き出せるよう支援することに専念している。

AWS Robotics Startup Accelerator

Amazon は、製品やサービスの開発、プロトタイプ、テスト、商業化のためのリソースを提供することで、ロボティクス企業を育成するという「Robotics Startup Accelerator」も発表した。

AWS が提供する技術的なリソースやネットワークとの戦略的な連携により、ロボット企業や業界全体の実験や革新を支援するとともに、ロボット企業やその技術をAWSの顧客基盤と結びつけることができる。(Amazon のブログ)

Robotics Startup Accelerator に採択されたスタートアップは、ビジネスモデルについて AWS とマスロボティクスの専門家と相談し、技術支援については AWS のロボティクス・エンジニアと相談する。特典として、AWS ロボティクスソリューションのハンズオントレーニングや、AWS の IoT、ロボティクス、機械学習サービスを利用するための最大1万米ドルのプロモーションクレジットが提供される。また、スタートアップは、MassRobotics から事業開発や投資に関するガイダンスを受け、ブログやケーススタディを通じて AWS との共同マーケティングの機会を得ることができる。

ロボット関連のスタートアップ、特に産業用ロボット関連のスタートアップは、自動化の流れの中で、ベンチャーキャピタルの注目を集めている。PitchBook のデータによると、2020年3月から2021年3月にかけて、ベンチャー企業はロボット関連企業に63億米ドルを注ぎ込み、2019年3月から2020年3月にかけて50%近く増加している。長期的に見ると、ロボット関連の投資額は過去5年間を通じて5倍以上に上昇し、2015年の10億米ドルから2020年には54億米ドルに達する。

Automation World は、レポートの中で次のように述べている。

選挙が終わり、新型コロナウイルスのワクチンが入手可能になると、市場が不安定でロボットの導入が遅れている業界でも多くの需要が戻ってくると考えているからだ。その一方で、すでに盛り上がりを見せている業界では、さらに速いペースで進んでいくことが予想される。

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

メンバーシップ「BRIDGE Members」に参加するとBRIDGEがお届けするスタートアップ・トレンドをまとめたメンバー向けマガジンコンテンツ「Canvas」を購読いただけます。一度に情報をキャッチアップしたい人や、BRIDGE Tokyoなどのコンテンツをチェックしたい方にお届け中です。
  • BRIDGE Canvasの購読
  • メンバー向けDiscordご招待
  • BRIDGE Tokyoなどイベントご招待
無料メンバー登録


次の一手は「企業向けSDK」ーー1.5兆円評価になったGrammarly(2)

SHARE:

セグメントの拡大 (前回からのつづき)パンデミック時に加速したデジタルトランスフォーメーションに後押しされ、特にマーケティングにおいて、コピーライティングを自動的に提案してくれたり、調整したりするAI技術を導入する企業の割合が増えると予想される。Phraseeの調査によると、マーケティングチームの63%が広告コピーの生成と最適化のためにAIへの投資を検討していると答えている。 また、65%が望まし…

セグメントの拡大

(前回からのつづき)パンデミック時に加速したデジタルトランスフォーメーションに後押しされ、特にマーケティングにおいて、コピーライティングを自動的に提案してくれたり、調整したりするAI技術を導入する企業の割合が増えると予想される。Phraseeの調査によると、マーケティングチームの63%が広告コピーの生成と最適化のためにAIへの投資を検討していると答えている。

また、65%が望ましいブランド向けの「ことば」をAIが生成できると信頼しており、82%がそのことばに対する消費者の反響データの恩恵を受けているという調査結果が出ている。

Grammarlyは、営業部門など特定の編集ニーズを持つ市場での訴求力を高めるため、企業が既存のウェブベースのアプリケーションにGrammarlyを活用したレコメンデーションを追加できる開発キット「Grammarly for Developers」を発表した。現在クローズドベータ版として提供されているGrammarly for Developersは、アプリとGrammarlyのクラウドサービス間の通信、下線やサジェスチョンカードの描画、テキスト変換の適用、個人辞書の提供などを実現する。Roy-Chaudhury氏は次のようにコメントしている。

「Grammarly for Developersでは、開発者が独自のテクノロジーを開発するために必要な時間とリソースを節約しつつ、ユーザーにより良いライティング体験を提供しようというものです。私たちの最初の製品であるテキストエディタSDKは、Grammarlyのコミュニケーション支援をあらゆるウェブベースのアプリケーションにももたらしてくれるはずです」。

6月にGrammarlyは最大50のスタイルガイド、スニペット、ブランドトーン、分析ダッシュボードのサポートなど、企業のコミュニケーションに焦点を当てた追加機能を発表した。スニペットは迅速なコミュニケーションのためにあらかじめ用意された回答テンプレートだ。ブランドトーンは、チームメンバーが使うべきトーンと避けるべきトーンを指定する「トーンプロファイル」になる。アナリティクス・ダッシュボードは、リーダーがコミュニケーションの傾向や強みを把握しやすくするための指標を表示してくれる。

GrammarlyにはWriter、Ginger、ProWritingAid、Slick Writeといった競合製品があり、これらの製品も同様にさまざまなユースケースに対応したAI搭載のライティングアシスタントを提供している。Fast Company誌に寄稿したある英語教授は、Grammarlyの修正提案は「ニュアンスへの理解を欠いている」と指摘し、例えば冗長性を過剰に排除しがちだと述べている

しかし、600人以上のチームメンバーを擁し利益を上げているGrammarlyは、これまでに3,000万人のユーザーと3万のチームを魅了してきたそうだ。新規および既存の顧客には、Frost & Sullivan、HackerOne、Lucid、Zoom、Cisco、Expediaなどが名を連ねている。

今回の資金調達により、同社の総資本は4億ドル以上に達した。

「2020年だけで、1兆2,000億のライティング提案を全世界のユーザーベースに届けました。 フォーブス・グローバル2000企業の68%がGrammarlyのユーザーを少なくとも1人抱えており、今後数年で大幅に増加すると予想しています。Grammarly Businessの大口契約のお客様の数は、この1年だけで250%以上増加しています。また、150カ国以上の6,800以上の非営利団体や非政府組織を無料でサポートしており、Grammarlyの教育部門では2,500以上の教育機関にそれぞれのニーズに合わせた機能を提供しています」(Roy-Chaudhury氏)。

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

メンバーシップ「BRIDGE Members」に参加するとBRIDGEがお届けするスタートアップ・トレンドをまとめたメンバー向けマガジンコンテンツ「Canvas」を購読いただけます。一度に情報をキャッチアップしたい人や、BRIDGE Tokyoなどのコンテンツをチェックしたい方にお届け中です。
  • BRIDGE Canvasの購読
  • メンバー向けDiscordご招待
  • BRIDGE Tokyoなどイベントご招待
無料メンバー登録


AIライティングのGrammarly、評価額は130億ドル(約1.5兆円)に(1)

SHARE:

カリフォルニア州サンフランシスコを拠点とし、AIを搭載したライティングアシスタントを開発しているGrammarlyは本日(訳注:原文掲載日は11月17日)、2億ドルの資金を調達したことを発表した。これにより同社の評価は投資後評価額で130億ドルとなる。このラウンドはBaillie Giffordがリードし、BlackRockが運用するファンドや顧客らが参加した。Grammarlyのグローバルヘッド…

Image Credit: Grammarly

カリフォルニア州サンフランシスコを拠点とし、AIを搭載したライティングアシスタントを開発しているGrammarlyは本日(訳注:原文掲載日は11月17日)、2億ドルの資金を調達したことを発表した。これにより同社の評価は投資後評価額で130億ドルとなる。このラウンドはBaillie Giffordがリードし、BlackRockが運用するファンドや顧客らが参加した。Grammarlyのグローバルヘッド・オブ・プロダクトであるRahul Roy-Chaudhury氏は今回の資金調達について、同社のテクノロジーをさらに発展させ、デジタルファーストの世界で人々のコミュニケーションを助けるための取り組みを加速させる ために使われると述べている。

企業がデジタル化を加速させる中、12億ドルを超えるAIライティングアシスタント市場は、2018年から2028年にかけて年成長率27.6%で成長すると予想されている。John Snow LabsとGradient Flowの調査によると、技術系リーダーの60%がGrammarlyのようなテクノロジーを有する自然言語処理の予算が2020年と比較して10%以上増加したと回答し、3分の1が30%以上増加したと回答している。Roy-Chaudhury氏は感染症拡大の影響が大きかったと本誌VentureBeatにメールで回答した。

「世界的な感染大流行は、私たちのコミュニケーション方法に大きな影響を与えました。学校や仕事など、すべてがリモートファーストにシフトしたことで、当社のようなデジタルコミュニケーション支援の必要性が高まったのです。パンデミックの影響で、人々はあらゆる種類の新しい接続環境や生産性向上のためのツールを使って遠隔地とのコミュニケーションを始めなければならなくなったのです」。

彼らのこれまで

ウクライナ出身の開発者、Alex Shevchenko(アレックス・シェフチェンコ)氏、Max Lytvyn(マックス・リトヴィン)氏、Dmytro Lider(ドミトロ・ライダー)氏らの発案により、Grammarlyは2009年にSentenceworksとして設立された。Lytvyn氏とShevchenko氏が盗用チェックのスタートアップ「MyDropBox」をBlackboardに売却した後に創業したもので、彼らの最初の製品の一つは、ユーザーがテキストを貼り付けることができる素朴なWYSIWYGエディタで、これがスペルや構文の提案をしてくれるアプリへと発展した。

2012年、Grammarlyはアカデミックな顧客層からより幅広い消費者市場へと軸足を移し、サブスクリプションプランを展開し、Facebook、Twitter、YouTubeへの広告掲載を開始した。2014年、GrammarlyはMicrosoft Office用のプラグインを発表し、文法チェックツールをOutlookやWordに統合した。また2015年には、ChromeとSafari向けにGrammarlyのブラウザ拡張機能をリリースしている。その後、Firefox用の拡張機能、Google Docs用のアドオン、iOSおよびAndroid用のメッセージ・メールスキャン機能付きGrammarly Keyboard、そしてMacOSおよびWindows用のデスクトップクライアントなどをリリースした。

現在、Grammarlyはエントリーレベルの英語のみのサービスであるGrammarly Premiumを月額30ドル(年額144ドル)で提供しており、企業向けのGrammarly Businessは1ユーザーあたり月額25ドルからとなっている。どちらのサービスにも、すべてのプラットフォームに対応したスタイルと語彙の推奨機能に加え、文の全面的な書き換えや、電子メール、文書、ブログに含まれる「怒り」(例:「攻撃的」、「苛立ち」、「興奮」)を識別するトーン検出機能が搭載されている。Grammarlyの広報担当者は2019年のインタビューでビジネスについてTechCrunchに次のように語っている。

「私たちのビジネスモデルはフリーミアムで、無料版のほか有料のアップグレード版であるGrammarly PremiumとGrammarly Businessを提供しています。Grammarlyがお金を稼ぐ唯一の方法はサブスクリプションです。つまり私たちは、広告を配信するなどのいかなる理由でもユーザーデータを第三者に売ったり貸したりすることはありません」。

10月現在、Samsung Keyboardが搭載されているSamsung製のスマートフォンはGrammarlyのスペルチェック技術の恩恵を受けることができる。ただ、Grammarlyの文章提案機能はSamsung Keyboardで利用できるが、プレミアム機能を利用するにはサブスクリプションが必要になる。

「将来に向けて重要なコミュニケーションのサポートを拡大するために、最新の製品である『Grammarly for Windows and Mac』を発売します。これはMicrosoft PowerPointやSlackのネイティブアプリなど、人々が文章を書くより多くの場所で、Grammarlyのリアルタイムなライティング支援を提供するための大きな一歩となるでしょう。効果的なコミュニケーションとビジネスパフォーマンスを気にするビジネスリーダーが増えたことで、私たちはGrammarly Businessへの需要の高まりに応える準備ができました」(Roy-Chaudhury氏)。

(次につづく)

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

メンバーシップ「BRIDGE Members」に参加するとBRIDGEがお届けするスタートアップ・トレンドをまとめたメンバー向けマガジンコンテンツ「Canvas」を購読いただけます。一度に情報をキャッチアップしたい人や、BRIDGE Tokyoなどのコンテンツをチェックしたい方にお届け中です。
  • BRIDGE Canvasの購読
  • メンバー向けDiscordご招待
  • BRIDGE Tokyoなどイベントご招待
無料メンバー登録