映画を60ヶ国語に翻訳・吹替・リップシンクする「Rask AI」、その技術のルーツはディープフェイクから

SHARE:
Image credit: Rask AI

2018年、世界がディープフェイクについて語り始めたとき、ビジネスの可能性を感じた。

Rask AI の創業者 Maria Chmir 氏は、ディープフェイクが彼女の好奇心をかき立てた理由をこう振り返る。

Rask AI は AI による動画音声翻訳サービスで、映画を60以上の言語に直接翻訳できるだけでなく、映画の登場人物をリップシンクさせたり、アクセントを調整したりすることもできる。例えば、中国語圏の映画制作者は、Rask AI を使うことで、映画の登場人物が単なる翻訳ではなく、実際に英語を話しているように見せることが簡単にできる。Rask AI のクライアントには、Universal Music などがいる。

Rask AI のディープフェイク技術を使えば、基本的な演出、オンライン講座、企業研修などを、翻訳者を雇うことなく直接グローバル市場にリリースすることができるのだ。しかし実は、Chmir 氏が最初にこのビジネスに参入したのは、会社を経営危機から救うためだった。

きっかけは、画像検索エンジン「Everypixel」の経営危機

Maria Chmir 氏

Chmir 氏は広告分野の修士号を取得した後、当然のように広告代理店に就職し、会社の顧客開拓とパートナーとの関係管理を担当した。その後、引き抜かれて広告会社のプロダクトマネージャーとして働くことになった。2年後、彼女は写真検索エンジンの Everypixel にプロダクトマネージャーとして採用され、うっかりディープフェイク技術への扉を開いてしまった。

2017年、Everypixel はユーザがさまざまな画像プラットフォームで検索し、質の悪い画像や構図の悪い画像を自動的にフィルタリングする AI 技術を開発した。この製品は消費者にとって非常に使い勝手がよく、大手メディアにも取り上げられたにもかかわらず、お金を稼ぐことができないという厄介な問題にぶつかった。

同社は、広告サービスの追加と投資家からの資本調達という2つの解決策を思いついた 前者は、広告スペースを購入する企業を引き付けるためにプラットフォームへのトラフィックを大幅に増やす必要があり、後者は Everypixel が投資家からr資金調達した経験が無かったため、成功の見込みはほとんどなかった。結局、Everypixel はこれらの選択肢のいずれも選ばず、3つ目の選択肢である AI 画像認識サービスに注力した。

Everypixel は、ユーザーがアップロードした写真にタグ付けし、自動的にテキスト説明を加える機能を社内で開発し、利益を上げようとしたが、最終的には失敗に終わった。当時、最高マーケティング責任者(CMO)に就任したばかりの Chmir 氏は、何が間違っていたのか考えていた。

彼女は、Everypixel が利益を上げられなかったのは、消費者の視点から製品を見ておらず、消費者と近いコミュニケーションを取っておらず、したがって、消費者の根本的なニーズを理解していなかったからであることに気づいた。

広告業界は「ブラックボックス」。今日、どのようなコンテンツを制作すればいいかわからないし、どの消費者がそれを購入するかもわからない。

2018年、ディープフェイク技術がより高度になりつつあった頃、Chmir 氏は、ベルギー社会民主党がディープフェイク技術を使って作成した偽トランプ動画を目にし、この技術をビジネスに利用し、利益を上げられないかと考えた。そこで、Everypixel のもう一つの AI 顔スワッピングツール「Reflect」で顧客を探し、これまで広告業界で培ってきた人脈に連絡を取ったところ、今回はついにそれが成功し、会社の収益が大幅に増加した。

Everypixel がようやく収益を上げ始めたため、同社の幹部はディープフェイク技術に専念することを決め、 Chmir 氏が創業者兼 CEO の役割を担う、映画・テレビ業界専門の新会社 Dowell を設立した。

約1年後、Dowell が正しい道を歩む一方で、ディープフェイクにさらなる可能性を見出そうとする Chmir 氏の野心が彼女を飛躍させ、Rask AI を設立させた。

Rask AI はエドテック企業?

Rask AI は、動画音声翻訳 SaaS だ。Chmir 氏の構想通り、このサービスは完全に自動化されており、ユーザは動画をアップロードし、言語を選択すると、それに応じて登場人物のリップシンクやアクセントを調整し、60以上の言語に自動翻訳される。

現在、25分間の翻訳が可能なベーシック版(月額49米ドル)と、100分間の翻訳が可能なアドバンス版(月額119米ドル)の2つの料金プランがあり、長編の場合はさらに1分ごとに1米ドルが加算される。

興味深いことに、Chmir 氏は同社をエドテック企業と位置づけ、ディープフェイク技術の力によって世界中のあらゆるコンテンツのリーチを広げようとしている。

我々は、人々が母国語で新しいことを学んだり、お気に入りのYouTuberを観たりできるように、言語の壁を打ち破っている。

Rask AI の利用は映画やテレビ業界だけでなく、YouTuber、オンライン講座、国際企業の社員研修講座を支援するなど、より広い文脈で利用されている。これは、Chmir 氏が数年前に学んだ「常に消費者を念頭に置いて製品を作る」という教訓を反映したものだ。

たとえ、ディープフェイク技術が歴史上の人物を「生き返らせる」ことができたとしても、彼女はディープフェイク技術には大きな開発課題が3つあると付け加えた。

第一に、キャラクターの過去の習慣的な行動、行動、感情を知ることは不可能である。

我々は、視聴者がヒーローの外見を作りたいのではなく、キャラクターの性格、性質、思考、言動、感情を表現したい場合が多いことを理解している。

第二に、照明がディープフェイクの顔スワッピング技術の完全性に影響を与える可能性がある。例えば、非常に暗い環境では、顔スワッピングを実現するのは難しい、ということ。そして、最後に、法律上のトラブルに巻き込まれやすいので、ライブラリ映像の許可には注意が必要ということだった。

【via Meet Global by Business Next(数位時代) 】 @meet_startup

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する