Soraの競合、中国製動画生成AI「Kling(可霊)」について知っておくべきこと

SHARE:
「Kling(可霊)」
Image credit: Kuaishou(快手)

もしあなたがソーシャルメディアで AI のインフルエンサーやクリエイターをフォローしているなら、新しい AI 動画生成モデル「Kling(可霊)」について、彼らがいつもより興奮しているのを見たかもしれない。

純粋なテキストプロンプトといくつかの設定可能なアプリ内のボタンや設定から生成される動画は、OpenAI のまだ非公開の招待制のクローズドベータ AI モデル「Sora」に匹敵する信じられないほどリアルに見える。OpenAI は Sora を少数のアーティストや映画制作者たちと共有し、この映画とその敵対的な(リスクの高い、好ましくない)使用法をテストしている。

実際、Kling は11日、YouTube チャンネルに、 Sora で作成した最初の サードパーティ動画の1つを模倣した動画を投稿した。クリエイティブエージェンシー shy kids による「air head」と言うものだ。

以下は、Kling の動画「風船男との一日」である。

そして以下は、shy kids が OpenAI の Sora を使って作った「air head」である。

Kling はどこから来たのか? それは何を提供するのか? そしてどうすれば手に入れることができるのか? それを知るには、続きを読んでほしい。

Kling とは何か、どこから来たのか?

South China Morning Post(南華早報)と web サイトは、この新しい AI 動画モデルは、中国で最も人気のある短編動画作成・視聴アプリ第2位「Kuaishou(快手、中国国外では Kwai)」のメーカーによって開発され、4億人のデイリーアクティブユーザ(DAU)がいると報じた。

Kuaishou/Kwai は、DAU 6億人を数える ByteDance(字節跳動)の中国版 TikTok の「Douyin(抖音)」にわずかに及ばない。

そのため、中国のユーザにとっては、すぐに興味を引かれ、新しい魅力的な動画モデルを手に入れるために Kuaishou をチェックするようになり、Douyin とのユーザ争奪戦に弾みをつけることになるだろう。

South China Morning Post は次のように説明している。

試験段階である Kling AI Model は、テキストを1080pの解像度で2分までのビデオクリップに加工することができ、様々なアスペクト比をサポートすると、アプリの運営者である Kuaishou Technology は述べている。また、プロンプトを解釈して、物理的な世界を模倣した動画を生成したり、テキストの指示から想像的なシーンを作成したりすることができる、と付け加えた。

Perplexity が引用した複数の情報源によると、Kling の AI モデルは次のようなものだという。

顔と体の再構成に独自の 3D Variational Autoencoder(VAE)を採用し、1枚の全身画像から詳細な表情と手足の動きを可能にしている。このテクノロジーは、3D 時空間ジョイントアテンションメカニズムによってさらに強化され、モデルが複雑なシーンや動きを扱うことを可能にし、生成されたコンテンツが物理法則に忠実であることを保証する。

Kling の利用方法と料金は?

Kling は、Kuaishou、Kwai、KwaiCut(後者は TikTok の CapCut と競合する動画編集アプリ)というアプリから無料でアクセスできる。

中国国外のユーザにとっては残念なことだが、モデルをダウンロードしてアクセスするには中国の電話番号が必要だとユーザは報告している。

しかし、ベンチャーキャピタル a16z パートナー Justine Moore 氏は、使い捨て電話番号を使用し、KwaiCut アプリから入力することが望ましいかどうかわからないと注意を促し、X に回避策を投稿した

アメリカの映画監督 Dustin Hollywood 氏も、ChatGPT を使ってアプリのメニューや画面を翻訳するアイデアを投稿した。

KwaiCut は何ができ、何に適しているのか?

初期のユーザによって投稿された動画によると、この新しい AI 動画生成モデルは、リアルなアクションシーンからあらゆるものを含む、高解像度で没入感のあるリアルで詳細な動画を幅広く作成するのに適している…

一人称視点のシューティングゲームを模倣したものから、「ハウス・オブ・ザ・ドラゴン」や「ゲーム・オブ・スローンズ」のようなハイ・ファンタジー・シリーズまで。

Dustin Hollywood 氏によると、「中級」レベルの複雑なテキストプロンプトに基づいて動画を生成するのに約2分かかるという。しかし、彼が指摘するように、この生成 AI は人種や肌の色を正確に描写するのに苦労している(同様の問題は、Google の Gemini の AI 画像生成機能がシリコンバレーの著名なリバタリアンや保守派から公然と嘲笑され、非難される原因となった)。

https://twitter.com/dustinhollywood/status/1799930203222802861

しかし、たとえ問題があったとしても、Kling が強力な新しい AI ツールであることは明らかであり、Dustin Hollywood 氏のような映画制作者たちに、すでに Sora に対する彼らの評価を再評価させ、OpenAI の招待制のリリース戦略に疑問を投げかけている。

Kling は、OpenAI、Runway、Pika のようなアメリカベースの AI 動画モデルプロバイダに、世代や解像度の質を上げるよう圧力をかけるだろうか? その可能性は高いと思われる。さて、彼らがすぐに Kling に匹敵できるかどうかは未解決の問題だ。

しかしいずれにせよ、もしあなたが AI 映画制作や映画制作全般に興味があるなら、Kling の登場は間違いなく興奮に値するものだ。ユーザに中国の電話番号を要求しない完全なアメリカリリースがそう遠くないことを祈る。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する