ElevenLabsの読み上げアプリ「Reader」に、名優ジェームズ・ディーンやバート・レイノルズらのAI音声が登場

SHARE:
「Reader」
Image credit: ElevenLabs

1週間前、元 Google と Palantir のエンジニアが設立した AI 音声スタートアップ ElevenLabs が、初の主要なコンシューマ向け製品アプリ「Reader」で話題を呼んだ。

現在 iOS で利用可能なこの製品は、ウェブ上のあらゆるテキストファイルやリンクを、さまざまな AI 音声やアクセントでナレーションされた AI オーディオに変換する専用のボイスオーバーソリューションだ。本日、同社はこのアプリの音声ライブラリを拡張し、故ハリウッドスターの Judy Garland 氏、James Dean 氏、Burt Reynolds 氏、Laurence Olivier 氏の AI 音声を追加すると発表した。

同社は、存命および故人のセレブリティの知的財産権を管理・保護する企業 CMG Worldwide と提携し、これらの象徴的な声を再現し発表した。さらに、今後数か月のうちに多くの著名な AI 音声を追加する予定だ。

Reader はあらゆるデジタルテキストに AI 音声を与える

ElevenLabs はこれまで、テキスト読み上げ、音声変換、吹き替え効果音作成のための AI モデルに特化してクリエイティブ業界に焦点を当ててきたが、Reader アプリは同社のテキスト読み上げ分野の研究をより洗練された形で提供するものだ。ユーザは記事、PDF、ニュースレター、300 ページの電子書籍など、あらゆるデジタルテキストのリンクやファイルを提供するだけで、アプリが即座にテキストを処理し、AI ナレーションを開始する。緑色のハイライターが AI の発話に合わせて各単語をハイライトしながら進行する。

この機能は英語で利用可能だが、ユーザは男性から女性まで、アメリカ英語からオーストリア英語、イギリス英語まで、11 の音声とアクセントから選択してカスタマイズできる。今回発表された象徴的な音声がこの体験に加わり、ユーザは亡くなったスターの声でコンテンツを発見し体験できるようになる。

例えば、L. Frank Baum 氏の「オズの魔法使い」を、その映画化作品に出演した故 Judy Garland 氏の声で聴くことができるのだ。

故人となったスターの家族にとって、AI による音声再現は、セレブリティの遺産を確実に残し、既存のファンが彼らとの再会を果たし、新世代のユーザが彼らを発見する方法を提供する機会となる。一方、ElevenLabs にとって、この発表は新しいアプリへのさらなるエンゲージメントを促進すると期待されている。

ElevenLabs のパートナーシップ責任者である Dustin Blank 氏は次のように述べた。

Judy Garland 氏、James Dean 氏、Burt Reynolds 氏、Laurence Olivier 氏は歴史上最も称賛された俳優たちです。私たちは彼らの遺産を深く尊重し、彼らの声を私たちのプラットフォームの一部として持つことを光栄に思います。彼らを私たちの成長するナレーターリストに加えることは、あらゆる言語と声でコンテンツをアクセス可能にするという私たちのミッションにおける大きな一歩となります。

AI 音声は悪用されないのか

ここで使用されているような音声クローン技術に関連する最大の懸念の 1 つは、有名人の音声再現が、彼らが実際には言っていないことを言ったように描写される可能性があることだ。バイデン大統領のロボコール事件は、このような問題の最大の例である。同様に、CEO の声がクローン化され、彼らや彼らの会社の評判を台無しにする可能性のあることを言わせられたらどうだろうか?

ElevenLabs はこれらの懸念を理解しており、安全性に特に焦点を当てて象徴的な音声機能のパートナーシップを拡大しようとしている。

ElevenLabs のグロースマーケティングを担当する Sam Sklar 氏は VentureBeat に対し、同社はセレブリティの音声を完全に管理しており、Reader アプリでのみ利用可能にしていると述べた。このアプリは、ユーザがデジタルテキストを個人消費用の AI ナレーションに変換することしかできないように設計されている — さらなる共有やダウンロードはできない。

例えば、Reader アプリを通じて、VentureBeat の記事を選び、Judy Garland にナレーションさせることができますが、それはあなただけのためです。ElevenLabs の音声ライブラリ(同社の別の web 製品)を通じて彼女の声にアクセスすることはできません。これは、彼らの声をプラットフォーム上の通常のテキスト読み上げツールと組み合わせて使用することはできず、また Reader アプリを通じて彼らが話すコンテンツをダウンロードや共有することもできないということです。(Sklar 氏)

ユーザが二次的なデバイスを通じて象徴的な音声ナレーションを録音するために有害なコンテンツをテキストとしてアップロードした場合、同社は AI ボイスオーバーを生成しない。利用規約に違反するヘイトスピーチやその他の形式のテキストを識別しブロックするための自動化された人間によるモデレーションプロセスが間に置かれている。

セレブの声を最初からクローン化するために音声ライブラリが悪用される可能性については、Sklar は次のように述べている。プラットフォームは複数の保護手段を備えて構築されており、その中には音声 captcha 認証が含まれ、クローン化のためにアップロードされた音声サンプルをユーザの音声録音と照合する。数回の試行後に音声が一致しない場合、クローン化リクエストは処理されない。また、高リスクと判断された音声のクローン化を禁止する音声ポリシー「no go」も実施されている。

これらの音声をクローン化しようとする試みはすべてブロックされます。(Sklar 氏)

これらの手順により、セレブ、俳優、ビジネスエグゼクティブの声がクローン化される可能性は減少するが、それでも違反のケースは発生する可能性がある。例えば、悪意のあるユーザが、会社が設置したモデレーション措置を回避するようなコンテンツを Reader アプリ用に巧妙に作成する可能性がある。

長期的には、ファンや愛好家向けの提供物として位置付けられているこの象徴的な音声機能が業界にどのような影響を与えるか、興味深く見守る必要がある。これをホストする Reader アプリは、今夏にグローバルで Android デバイスにもロールアウトされる予定だ。さらに多くの言語のサポートも準備中だ。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する