Googleが最高品質の画像生成モデル「Imagen 3」を発表、プライベートプレビュー版が利用可能に〜Google I/O 2024から

Google は画像生成モデルの更新版を開発中だ。新しい「Imagen 3」は信じられないほどの詳細さ、自然言語の理解力の向上、テキストレンダリングの改善を実現したと述べている。選ばれたクリエイターにはプライベートプレビューで ImageFX から利用可能で、開発者はウェイティングリストに登録できる。Imagen 3は Vertex AI でも提供される予定だ。

Google DeepMind のシニアリサーチディレクタ Douglas Eck 氏は同社の開発者会議「I/O」で次のように説明している。

これまでで最も優れた画像生成モデルです。Imagen 3はより写実的で、豊かな詳細と目立つ視覚的なアーティファクトやゆがんだ画像がありません。人間が書くようなプロンプトを理解できます。より創造的で詳細なプロンプトを入力すればするほど、よりよい結果が得られます。また、Imagen 3は長いプロンプトの中のディテールも記憶して取り入れます。さらに、私たちがこれまで画像生成モデルに挑んできた中で最高のテキストレンダリングモデルです。

14日のモデル発表は、Google が Imagen 2 を Vertex AI で一般提供してから6か月後のことだ。同社は先月、このモデルにテキストからライブ映像への変換機能も追加した。しかし、この取り組みは些細なことではない。Google にとって、DALL-E（OpenAI）、Midjourney、Adobe の Firefly、Meta の AI、Microsoft の Designer などの画像生成ツールを持つ AI 競合他社に一歩先んじることが極めて重要なのだ。

しかし、この分野で Google がすべてを手にしているわけではない。今年初め、同社の AI が米国建国の父として黒人男性の画像を生成したり、第二次世界大戦時の独軍兵士として黒人男性とアジア人女性の画像を生成したりしたことで「過剰に意識しすぎている」と非難された。Google はこの件について謝罪し、的を外していたと述べた。CEO の Sundar Pichai（サンダー・ピチャイ）氏も、Bloomberg の Emily Chang 氏とのインタビューでこのメッセージを繰り返した。

Imagen 3の発表は、新しい動画生成モデル「Veo」のローンチなど、Google I/O からの数多くの注目の発表の一つだ。

【via VentureBeat】 @VentureBeat

【原文】