Google の Imagen 2、4秒間のアニメーション画像を作成可能に

SHARE:
Image editing in Imagen 2 on Vertex AI. Image credit: Google/YouTube screenshot

Google の画像生成モデルファミリーは、重要なアップデートを受けている。同社は、Imagen 2 がテキストからライブ機能を受け取り、テキストプロンプトをアニメーション画像に変換することができるようになったと発表した。さらに、AI モデル内での画像編集(インペインティング、アウトペインティング、デジタルウォーターマーク)は、現在一般に利用可能である。

Google Cloud Next カンファレンスで発表された Imagen 2 のテキスト・ライブ機能は、最初は 24 フレーム/秒、360×640 ピクセルの解像度、4秒間の長さで、アニメーション GIF 相当のものを生成する。ただし、Google は「継続的な機能強化」の計画があると述べている。

Google Cloud の CEO である Thomas Kurian (トーマス・クリアン) 氏は、記者会見で「車の静止画のような物体の写真ではなく、アニメーション化された動く車のような短い画像を見ることができる。特にメディアや広告の分野では、多くの組織がこれに注目している。なぜなら、ユーザーとのエンゲージメントを向上させる」と述べている。

Google は、Imagen 2 が「シーケンス全体の一貫性をサポートしながら」、さまざまなカメラアングルとモーションを使用して画像を作成できると述べている。また、安全性フィルターとデジタルウォーターマークも備えており、生成型 AI に関する組織の 2 つの主要な懸念に対応している。

一般公開された画像編集機能については、Imagen 2 は Adobe Photoshop の生成型塗りつぶしやコンテンツ対応と同様に、写真の要素を追加または削除できる。また、より広い視野を提供するために画像の境界を拡張することも可能である。

これらのアップデートは、Google が完全に管理するクラウド AI プラットフォームである Vertex AI に関する発表の一部である。

Imagen 2 は 2023 年に発売された。これは Google の DeepMind の製品であり、自然言語プロンプトから写真のようにリアルで高解像度で美的に優れた画像を生成する AI としてマーケティングされている。OpenAI の DALL-E、Midjourney、Adobe Firefly と競合状態にあり、企業がブランドのガイドラインとガバナンスのニーズに合った画像を作成するのに役立つように特別に作られている。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する