OpenAI、60秒の動画を生成できるAIモデル「Sora」発表 - BRIDGE（ブリッジ）テクノロジー＆スタートアップ情報

OpenAIは、ChatGPTやLLMの会社として知られるだけでは満足しないようだ。本日（原文掲載日は現地時間で15日）、テキストからビデオへの生成モデルである「Sora」のデモを公開し、共同創業者兼CEOのSam Altman（サム・アルトマン）氏はX（旧Twitter）に「驚くべき瞬間」だったと投稿した。

この製品は、Altmanが自身の投稿で「レッドチーミング（訳註：セキュリティの専門家が敵の攻撃者（レッドチーム）の役割を担い、組織の防御システムや手順の弱点を発見しようとするプロセス）を開始する」、つまりセキュリティの防御や欠陥、誤用に対する反対テストを行うためのもので、まだ一般ユーザーが正式に使用できるものではない。Altman氏は「限られた数のクリエイター」が利用できるようになり、後日に一般公開される予定であることを明記している。

Soraのビデオ／Credit: OpenAI

ビデオAIモデルの激しい競争

Soraは激しい競争の場に参入することになる。というのも、既存のライバル新興企業であるRunway、Pika、Stability AIが専用のビデオ生成AIモデルを提供しているほか、Googleのような有力企業がLumiereモデルを披露しているからだ。

しかし、本日公開されたOpenAIのSoraのサンプル動画は、解像度のシャープさ、動きの滑らかさ、人間の解剖学的・物理的世界の正確さ、そして何よりも実行時間の長さで際立っている。

Soraのビデオ／Credit: OpenAI

RunwayやPikaが一度に4秒のビデオ生成を提供し、オプションで拡張可能になっているのと異なり、OpenAIのSoraはすぐに60秒のビデオ生成を提供する。

Altman氏を始めとするOpenAIのリーダー陣とSoraチームのメンバー、そして研究者のWill Depue氏らは、Twitter/Xでユーザーからのプロンプトを集めており、Soraを通してこのモデルの新機能のライブデモをクラウドソースで行っている。

https://t.co/SOUoXiSMBY pic.twitter.com/JB4zOjmbTp

— Sam Altman (@sama) February 15, 2024

幻想的なビデオ以上に、高架電車から見える街並みや、猫とベッドで寝ている女性のホームムービーなど、ありふれた、しかし人間の生活の中で認識できる瞬間を再現するSoraの能力を示すビデオは、衝撃的なほどリアルだ。

また、OpenAIの研究者であるBill Peebles氏は「人工汎化知能」（経済的に価値のあるタスクのほとんどにおいて、ほとんどの人間よりも優れた性能を発揮するAIと定義される）の開発に取り組んでおり、Soraは「すべてをシミュレートする」ことでAGIの探求に貢献するだろうと述べている。

Sora is here! It's a diffusion transformer that can generate up to a minute of 1080p video with great coherence and quality. @_tim_brooks and I have been working on this at @openai for a year, and we're pumped about pursuing AGI by simulating everything! https://t.co/DzbyReLJEc pic.twitter.com/IFqfh8H6FW

— Bill Peebles (@billpeeb) February 15, 2024