声に特化した「ジェネレーティブAI」Voicemodが1,450万ドル調達

SHARE:

ピックアップ:Voicemod tools up with $14.5M to ride the generative AI (sonic)boom

ニュースサマリー:「声」のジェネレーティブAIを開発するVoicemodは2月、新たな資金調達を公表している。2014年創業の同社はサウンド絵文字、声のエフェクトに加えて、完全に合成された声を作成するツールを提供する。伝えているTechCrunchによると、主要製品であるVoicemod for Desktopはこれまでに4,000万回以上ダウンロードされ、月間アクティブユーザー数は330万人に上るそうだ。マドリッドを拠点とするVCファンドLeadwindがリードするシリーズAラウンドで1,450万ドルを調達した。

デジタル信号処理(DSP)技術は主にゲーマーがボイスチャットを盛り上げるための楽しい「サウンド絵文字」エフェクトやリアクション音声の作成をすることが多かった。一方、Voicemodのツールを使うとユーザーがこれらの声をリアルタイムに「生成」できるため、自分のものではない声で話すことが可能になる。ドラえもんのひみつ道具「声紋キャンデー製造機」や名探偵コナンの「蝶ネクタイ型変声機」といえばわかりやすいだろうか。

Discordなどのコミュニケーションツールでリアルタイム変換した声で会話ができるもので、現在のAI音声はβ版であるため機能が限られている。無料版では日替わりで「Custom Piitch」「Voice Enhancer」などの用意されたサウンドエフェクトを使用できる。有料版だと全てのサウンドエフェクトが利用可能となり、さらにVoiceLao機能を使って自分の理想のボイスを出せるエフェクト作成機能や、AIボイスチェンジャー機能を使用することができる。有料版は現在、日本円で月額980円、年間プラン3600円、永久ライセンス1万円が用意されている。

Voicemodは昨年、バルセロナの歌唱AIを手掛けるVoctro Labsを買収しており、ジェネレーティブAIを使用してテキストから自分の声で歌う曲へ変換できる機能を追加した。VoiicemodのCEOであるJamie Bosch氏は取材記事の中で「音声読み上げのAIリアルタイム技術を強化する」とも語っている。

競合となる音声系のAIの話題については、Voicemodと同じく人間の声の合成してゲームやプレゼンテーションなどに使われているVoice AIや、元GoogleのエンジニアであるPiotr Dabkowski氏らが設立したElevenLabsなどがある。

共同執筆:佐々木俊

BRIDGE Members

BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。
  • 会員限定記事・毎月3本
  • コミュニティDiscord招待
無料メンバー登録