OpenAI、60秒の動画を生成できるAIモデル「Sora」発表

SHARE:

OpenAIは 、ChatGPTやLLMの会社として知られるだけでは満足しないようだ。本日(原文掲載日は現地時間で15日)、テキストからビデオへの生成モデルである「Sora」のデモを公開し、共同創業者兼CEOのSam Altman(サム・アルトマン)氏はX(旧Twitter)に「驚くべき瞬間」だったと投稿した。

この製品は、Altmanが自身の投稿で「レッドチーミング(訳註:セキュリティの専門家が敵の攻撃者(レッドチーム)の役割を担い、組織の防御システムや手順の弱点を発見しようとするプロセス)を開始する」、つまりセキュリティの防御や欠陥、誤用に対する反対テストを行うためのもので、まだ一般ユーザーが正式に使用できるものではない。Altman氏は「限られた数のクリエイター」が利用できるようになり、後日に一般公開される予定であることを明記している。

Soraのビデオ/Credit: OpenAI

ビデオAIモデルの激しい競争

Soraは激しい競争の場に参入することになる。というのも、既存のライバル新興企業であるRunwayPikaStability AIが専用のビデオ生成AIモデルを提供しているほか、Googleのような有力企業がLumiereモデルを披露しているからだ。

しかし、本日公開されたOpenAIのSoraのサンプル動画は、解像度のシャープさ、動きの滑らかさ、人間の解剖学的・物理的世界の正確さ、そして何よりも実行時間の長さで際立っている。

Soraのビデオ/Credit: OpenAI

RunwayやPikaが一度に4秒のビデオ生成を提供し、オプションで拡張可能になっているのと異なり、OpenAIのSoraはすぐに60秒のビデオ生成を提供する。

Altman氏を始めとするOpenAIのリーダー陣とSoraチームのメンバー、そして研究者のWill Depue氏らは、Twitter/Xでユーザーからのプロンプトを集めており、Soraを通してこのモデルの新機能のライブデモをクラウドソースで行っている。

幻想的なビデオ以上に、高架電車から見える街並みや、猫とベッドで寝ている女性のホームムービーなど、ありふれた、しかし人間の生活の中で認識できる瞬間を再現するSoraの能力を示すビデオは、衝撃的なほどリアルだ。

また、OpenAIの研究者であるBill Peebles氏は「人工汎化知能」(経済的に価値のあるタスクのほとんどにおいて、ほとんどの人間よりも優れた性能を発揮するAIと定義される)の開発に取り組んでおり、Soraは「すべてをシミュレートする」ことでAGIの探求に貢献するだろうと述べている。

AIが詐欺や実在の人物のディープフェイクにつながる可能性があるとして、米連邦政府機関がAIを規制する動きを強めるなか、Soraの登場は、OpenAIだけでなく、テック・メディア業界全体、そして人類全体にとって画期的な出来事と言えそうだ。

BRIDGE Members

BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。
  • 会員限定記事・毎月3本
  • コミュニティDiscord招待
無料メンバー登録