![](https://i0.wp.com/thebridge.jp/wp-content/uploads/2023/12/843447_robots-creating-a-video-movies-_xl-1024-v1-0-640x480.png?resize=640%2C480&ssl=1)
テキストからの画像生成サービス「Stable Diffusion」で知られるStability AIは、新たな画像から動画へのモデル、Stable Video Diffusion(SVD)をサードパーティの開発者が自身のアプリ、ウェブサイト、ソフトウェア、サービスに組み込むことができるようになったと発表した。開発者向けプラットフォームとアプリケーション・プログラミング・インターフェイス(API)で利用可能となる。
同社はブログに「新機能では、様々な分野向けに設計された最先端のビデオモデルへのアクセスを提供します。開発者に高度なビデオ生成を製品にシームレスに統合する効率的な方法を提供することが狙い」と記述している。
ただこのリリースはAIビデオを生成しようとしている企業に役立つ一方、いくつかの懸念を引き起こす可能性もある。
というのもStability AIは、少なくとも1,008件の児童性的虐待を含むことが判明し、今週オフラインにされたオープンソースのAIデータセット「LAION-5Bでモデル」をトレーニングしたことですでに非難を浴びているからだ。
Stability AIのLinkedIn投稿によると、Stabilityの新しいSVD APIプラグインはアプリに生成ビデオを組み込もうとしている個人や企業に「平均41秒以内、25生成フレームと24フレームのFILM補間からなる2秒間のビデオ」を提供し、品質選択肢のひとつを提供する。 大がかりな動画キャンペーンには不十分かもしれないが、ミームなど特定のメッセージ性を持つGIFを制作するのに重宝することは間違いない。
このサービス開始はRunwayやPika Labsといったビデオ生成モデルに対抗するものになるだろう。後者については最近、Lightspeed Venture Partnersから5,500万ドルを調達し、動画を生成・編集する新しいウェブプラットフォームをデビューさせている。
しかし、どちらも動画生成AIモデルをAPIを通じて利用できるようにはしておらず、利用するにはそれぞれのウェブサイトやアプリに直接アクセスする必要がある。
注目すべきことに、Stabilityはビデオ・ジェネレーター用のユーザー向けウェブ体験も発表する予定だ。同社は、このインターフェイスを試す最初のユーザーになるため、ウェイティングリストに参加するようユーザーに呼びかけている。
安定したビデオ拡散の機能
ほぼ1カ月前に発表されたStable Video Diffusionは、JPGやPNGなどの静止画でプロンプトを表示してMP4動画を生成することができるものだった。
同社が共有したサンプルによると、このモデルは必要なクリップを作成する点ではきちんと仕事をしているが、まだ発展途上で、最大2秒の短いビデオしか作成できない。これは、研究中心のビデオモデルによって生成される4秒のクリップよりもさらに短い。しかしもちろん、複数のビデオクリップをつなげてより大きなビデオにすることもできる。同社は広告、マーケティング、テレビ、映画、ゲームなどの分野で役立つと主張している。
さらに興味深いのは、先月発表されたプロービングとフィードバックのモデルとは異なり、最近発表されたものは、1024×576、768×768、576×1024など、複数のレイアウトと解像度でビデオを生成できることだ。また、動きの強さの制御や、シードベースの制御といった機能も追加されており、開発者は繰り返し生成かランダム生成かを選択することができる。
物議を醸しながらも安定したレースを続ける
トレーニングデータのソースに多くの疑問がある中にも関わらず、Stable Video Diffusionの発売は企業が自社製品にビデオ生成機能を組み込む簡単な方法を提供し、同社が市場獲得に向けて競争する準備ができていることを示している。
前述した通り、Stanford Internet Observatoryからの報告で、Stable Diffusion 1.5(Runwayがリリースし、Stabilityがサポートしている)を含む人気のAIテキスト画像生成ツールにおいて、トレーニングに使用されている無料のLAION-5Bデータセットには、少なくとも1,008件の児童性的虐待が含まれていることが判明した。発行元のLAION社は現在、このデータセットを削除している。
今年初めにも、同社はLAIONに「Stable Diffusion」を作成するために「何十億件もの著作権で保護された画像のコピーを許可なく」入手したとして、集団訴訟で訴えられた。
現在、Stabilityの開発者向けプラットフォームAPIは、Stable Diffusion XLテキスト画像ジェネレーターから新しいSVDモデルまで、同社の全モデルへのアクセスを提供している。同社はまた、顧客がローカルでモデルをホストするためのメンバーシップも提供している。
【via VentureBeat】 @VentureBeat
Members
BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。無料で登録する