OpenAI、60秒の動画を生成できるAIモデル「Sora」発表

SHARE:

OpenAIは 、ChatGPTやLLMの会社として知られるだけでは満足しないようだ。本日(原文掲載日は現地時間で15日)、テキストからビデオへの生成モデルである「Sora」のデモを公開し、共同創業者兼CEOのSam Altman(サム・アルトマン)氏はX(旧Twitter)に「驚くべき瞬間」だったと投稿した。

この製品は、Altmanが自身の投稿で「レッドチーミング(訳註:セキュリティの専門家が敵の攻撃者(レッドチーム)の役割を担い、組織の防御システムや手順の弱点を発見しようとするプロセス)を開始する」、つまりセキュリティの防御や欠陥、誤用に対する反対テストを行うためのもので、まだ一般ユーザーが正式に使用できるものではない。Altman氏は「限られた数のクリエイター」が利用できるようになり、後日に一般公開される予定であることを明記している。

Soraのビデオ/Credit: OpenAI

ビデオAIモデルの激しい競争

Soraは激しい競争の場に参入することになる。というのも、既存のライバル新興企業であるRunwayPikaStability AIが専用のビデオ生成AIモデルを提供しているほか、Googleのような有力企業がLumiereモデルを披露しているからだ。

しかし、本日公開されたOpenAIのSoraのサンプル動画は、解像度のシャープさ、動きの滑らかさ、人間の解剖学的・物理的世界の正確さ、そして何よりも実行時間の長さで際立っている。

Soraのビデオ/Credit: OpenAI

RunwayやPikaが一度に4秒のビデオ生成を提供し、オプションで拡張可能になっているのと異なり、OpenAIのSoraはすぐに60秒のビデオ生成を提供する。

Altman氏を始めとするOpenAIのリーダー陣とSoraチームのメンバー、そして研究者のWill Depue氏らは、Twitter/Xでユーザーからのプロンプトを集めており、Soraを通してこのモデルの新機能のライブデモをクラウドソースで行っている。

幻想的なビデオ以上に、高架電車から見える街並みや、猫とベッドで寝ている女性のホームムービーなど、ありふれた、しかし人間の生活の中で認識できる瞬間を再現するSoraの能力を示すビデオは、衝撃的なほどリアルだ。

また、OpenAIの研究者であるBill Peebles氏は「人工汎化知能」(経済的に価値のあるタスクのほとんどにおいて、ほとんどの人間よりも優れた性能を発揮するAIと定義される)の開発に取り組んでおり、Soraは「すべてをシミュレートする」ことでAGIの探求に貢献するだろうと述べている。

AIが詐欺や実在の人物のディープフェイクにつながる可能性があるとして、米連邦政府機関がAIを規制する動きを強めるなか、Soraの登場は、OpenAIだけでなく、テック・メディア業界全体、そして人類全体にとって画期的な出来事と言えそうだ。

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する