Amazon、ジェネレーティブAI対応版「Alexa」を発表

SHARE:
Image credit: Amazon

Alexa、チャットしよう。

音声で起動する Echo デバイスをデビューさせてから約10年、e コマースとクラウド大手の Amazon は 20日、同社の代表的な音声アシスタント「Alexa」にシリコンバレーで流行っているジェネレーティブ AI を組み込むため、さらに多くの機能と人間のような会話品質を与える、新たにカスタム構築された大規模言語モデル(LLM)でアップグレードすると発表した。

このニュースは、ワシントン D.C.郊外のバージニア州にある豪華な本社「HQ2」で、Amazon のデバイスサービス担当上級副社長(SVP)の David Limp 氏によって伝えられた。

新しい Alexa LLM は、Alexa 搭載デバイスで無料プレビューとして利用できるようになり、Amazon は「よりスマートで、より会話的」であり、その音声はより「リアルで カジュアル」であると主張している。

Amazon の SVP で AI のヘッドサイエンティスト Rohit Prasad 氏は、このニュースは私たちが愛するアシスタントの大変革を意味すると述べた。

リアルの世界では、ChatGPT を追い越したい Amazon

Amazonの会話型 LLM 分野への参入は、OpenAI が「ChatGPT」で世界に衝撃を与え、一夜にして有名になったほぼ1年後のことだが、同社は新しい Amazon LLM を待った甲斐があったと主張している。

Amazon によれば、ナレッジベースが2021年末か2022年初めに停止する ChatGPT とは異なり、Alexa LLM は「リアルタイムの情報」を提供し、以前のバージョンの Alexa よりも「より会話的」で「待ち時間が少ない」という。

Amazon はイベント中、ChatGPT を名指しで呼び、Alexa LLM はブラウザやモバイルでの  ChatGPT を超えるもので、レシピや旅行のアイデアについて会話したり、詩を書いたりといった実世界のアプリケーションをユーザに提供すると述べた。

私たちの LLM が特別なのは、ただ教えてくれるだけでなく、実践してくれるからです。(Prasad 氏)

このアイデアを説明するかのように、Limp 氏は集まった報道陣や Amazon 社員の前でライブデモも行い、好きなフットボールチームはどこかと尋ねると、Alexa は彼がヴァンダービルト大学を指していることを覚え、パーソナライズされた機能を披露した。また、ユーザの好きなチームが勝利した場合は、喜びの声で応答するという。

また、Limp 氏は Alexa に、友人たちに今度のヴァンダービルトのフットボールの試合を見るように思い出させるメッセージを書いて、彼の携帯電話に送るように頼んだが、アシスタントは数秒でその動作を実行した。

Amazonはプロモーションビデオを上映し、新しい Alexa LLM がユーザにとって家族の一員であることを示唆した。

4つの主要コンポーネントとサードパーティ製アプリ

Prasad 氏によると、新しい Alexa LLM は、実世界のデバイスとサービス、パーソナルコンテキスト、そして責任ある AI という4つの主要コンポーネントを中心に構築されているという。

実際、別の発表者である Amazon の Alexa コネクション&エッセンシャルズ 担当副社長 Heather Zorn 氏は、開発者はサードパーティ製のカスタムで専用に作られた LLM のいくつかを Alexa に連携することが可能であり、すでに連携していると述べた。

Amazon では、ユーザはさまざまな架空のキャラクターや原型を作成し、交流することができ、25種類の性格タイプを提供している。

別のデベロッパ Splash は、アプリの Alexa との連携により、ユーザ曲の作成とプレビュー機能を提供している。

内包された印象的な技術

Prasad 氏によると、Alexa の音声合成エンジンは現在、感情や声のトーンについてより文脈を認識し、スピーカーの声のトーンと同じような感情の変化を出力で表現するようになっているという。

また、会話用に設計された新しい自動音声認識システムも搭載されており、クラス最高のものをさらに良くし、巨大な変圧器モデルを使用している。

画面とビデオカメラを内蔵した「Amazon Echo Show」の場合、ビジュアル ID に登録した Amazon のユーザは、デバイスを見るだけで話しかけることができる。もう Alexa と何度も言う必要はなく、他の人を見ているときと同じようにアシスタントと会話を続けることができる。

Prasad 氏によれば、これはデバイス上の視覚処理と音響モデルが連動することで、あなたがAlexa に話しかけているのか、それとも部屋にいる他の誰かに話しかけているのかが認識できるからだという。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する