Sensory、コンシューマ向け音声AIにChatGPTを連携——あらゆる家電をスマートスピーカー化

SHARE:
コンシューマ端末にジェネレーティブ AI 連携の音声チャットをもたらす Sensory

コンシューマ向けの音声 AI メーカー Sensory は、ChatGPT などの AI を連携し、コンシューマデバイスでの会話型音声応答を進めると発表した。

これは、キーボードや大画面を持たないデバイスをよりスマートにすることを目的としている。耳かけ型音声アシスタント、スマートウォッチ、スマートフォン、自動車用インフォテインメントシステムなどをターゲットに、コンシューマ製品上で高速かつシームレスな会話体験を実現し、多数のエレクトロニクス企業とその顧客に対して最高の会話型機能を提供すると述べた。

ジェネレーティブ AI は、コンシューマ向けデバイスをこれまで以上にスマートにする可能性を秘めている。この強力な新技術を当社の堅牢な音声AIスタックと統合することは、市場にとってゲームチェンジャーとなり、顧客はさまざまなカスタマイズされたドメインに合わせた無限の能力を持つ新世代の音声アシスタントを作ることができる。(Sensory の CEO Todd Mozer 氏)

同社によると、Sensory は精度の高い音声 AI ソリューションで定評があり、ジェネレーティブ AI によってさらに精度が高まるという。同社の技術スタックには、以下のようなものがある。

  • ウェイクワード認識。
  • 文脈と AI が生成したプロンプトエンジニアリングによる正確な音声テキスト化で、理想的なジェネレーティブAIの結果を保証する。
  • ジェネレーティブ AI だけに依存するプラットフォームで起こる「AI の幻覚」を回避することができる。
  • 音声合成により、ユーザーは生成された応答を自然な音声で聞くことができる。

また、Sensory の会話型 AI 機能では、ユーザがフォローアップの質問や、元のリクエストにフィルター、ソート、コマンドで尋ねることができ、会話をより自然で人間らしいものにすることができる。

今回のローンチにより、Sensory の機能があらゆるタイプのデバイスに拡張され、企業はより魅力的でインタラクティブな製品を作る機会を得ることができる。(Mozer 氏)

Sensory のハイブリッドクラウド+エッジ AI プラットフォームでは、エンドユーザ体験とセキュリティを強化するための強力な AI 技術を数多く実装し、エッジデバイスとクラウド間でAI推論業務を分割することを選択することができる。

超低消費電力デバイスの例としてスマートウォッチを挙げると、ウェイクワードの認識、話者の確認、簡単な音声コントロール、音の識別といった軽負荷の AI は、デバイス上で実行できる。より複雑な AI 推論、例えばウェイクワード、スピーカー、サウンド ID の再検証、ドメインに特化したアシスタント、自然言語理解エンジンは、スマートフォンのようなより強力なコネクテッドデバイスにルーティングすることができる。また、ジェネレーティブ AI や今のボイスチャットのような高馬力の AI 推論については、改良された再検証、顔や物体の認識などをクラウドにルーティングすることが可能である。

SensoryCloud の音声アシスタントソリューションは、Go、gRPC、NVIDIA Triton、AWS Global Accelerator を含む最先端の技術によって提供されている。超高速のプログラミング言語「 Go 」は、最も要求の厳しいワークロードにも対応できるスケーラブルで高性能なアプリケーションを構築する。gRPCは、コンポーネント間でシームレスに通信するための高度な SDK の作成を可能にする。SensoryCloud は、独自の技術でダイアログデータを圧縮し、クラウド料金の削減とレイテンシーの減少を実現している。

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。
  • 会員限定記事・毎月3本
  • コミュニティDiscord招待
無料メンバー登録