Midjourney、Photoshopの画像生成AI「ジェネレーティブ塗りつぶし」に対抗する機能を追加

SHARE:
Image credit: Midjourney

画像生成 AI の最先端を行くスタートアップの一つ Midjourney は、ジェネレーティブ塗りつぶし機能を発表した。

AI を搭載した画像生成ツールの利用法として、既存の画像にまったく新しい要素を追加する方法が増えている。これは「インペインティング」「インフィリング」「フィリング」などと呼ばれるが、それぞれのプロセスはほぼ同様である。

何十年も前からあるような単純な切り貼りではなく、ユーザは画像の一部を選択し、画像に追加したい内容をテキストボックスに入力するだけで、これらの機能を利用できる。AI は自動的に新しいオブジェクトや被写体を生成し、あたかも最初からそこにあったかのように画像を修正するのだ。また、ユーザが入力した内容に基づいて、すでに画像にあるものを自動的に削除、置換、調整することもできる。

これは信じられないほど直感的で効率的な AI プロセスであり、画像編集をスピードアップし、簡素化する。

先週、Midjourney が紹介したインフィリング機能は、「various(region)」と呼ばれている。これは、Midjourney が生成した画像の特定の領域に焦点を当て、異なる結果を得るために再ロールすることができるセレクターツールである。Discord の Midjourney インターフェースの variage(region)ボタンをクリックすると、長方形選択ツールと投げ縄選択ツールの2つのツールボタンがあるエディターウィンドウがポップアップする。どちらかを使って修正したい領域を選択し、Submit をクリックすると、AI が画像の特定の部分を自動的に再生成する。

テキストを使って新しいリージョンを生成することもできる。settings と入力し、remix mode をオンにするだけで、上記のエディタにテキストボックスが表示される。選択したリージョンのプロンプトを変更できるようになり、さらにコントロールとカスタマイズができるようになった。

もはや Adobe ユーザだけのものではない「ジェネレーティブ塗りつぶし」

Adobe の Photoshop は、何十年もの間、画像編集のための代表的なソフトウェアであり、2023年5月にデビューしたジェネレーティブ塗りつぶし機能は、デザイナーやイラストレーター、その他の AI ユーザから最高のものの一つとして賞賛されている。

しかし、Midjourney の新しい various(region)機能によって、状況は変わりつつある。ソーシャルメディア上のユーザは直接比較し、すでに感動している。

ひとつ難点があるとすれば、まだ自分のコンテンツをアップロードできないので、Midjourney が生成した画像にしかインフィルツールを使えないことだ。

Photoshop の年間購読料が約240米ドルであることを考えると、Midjourney は、これらの新しい種類のツールを活用するための、より手頃な方法をユーザに提供している。Midjourney の基本プランは月額わずか10米ドル、1年分を前払いする場合は96米ドルだ。ただし Midjourney は、ブラシ、パレット、レイヤー、レイヤーマスクなど、Photoshop よりもはるかに限定されたツールセット全体を提供している。一方、Stable Diffusion のインペインティングは研究目的のみで使える状況だ。

さて、ここで少し学習が必要になるが心配はいらない。Midjourney から新機能の最適な使い方のヒントがある。various(region)は、画像の20%から50%程度の大きな領域に最適だ。より小さな微調整には、代わりに vary(subtle)ツールを使うとよいだろう。プロンプトを変更するときは、画像全体の文脈に関連したものにするといい。

Midjourney の発表には次のように書かれている。

プロンプトを変更する場合、そのイメージにマッチした変更(キャラクターの上に帽子を追加する)であれば、極端に場違いなもの(森の中のイルカ)よりも効果的です。

急速に進化する AI デザイン機能

プロンプトのリミックスツールはまだ日が浅い。Midjourney によれば、このツールは時に予測不可能で、要求したものとは正反対のアウトプットを生成することがあるという。

Vary(region)は、Midjourney がポートフォリオに追加した新機能のひとつに過ぎない。6月には Pan が導入され、画像クリエイターは生成されたコンテンツのボーダーエッジにコンテキストを意識した塗りつぶしを追加できるようになった。

より一般的には、デザイン分野におけるジェネレーティブ AI は定期的に進化している。先々週、OpenAI のブログ投稿によると、OpenAIは クリエイティブなツール、インフラ、デジタル体験を構築するスタジオ Global Illumination の買収を発表した。また、強力な AI 対応ツールを備えたブラウザベースの画像エディタ Modyfi は、700万米ドルの資金調達を発表し、パブリックベータに入った。

一言で言えば、Midjourney は AI インフィル機能 various(region)で、クリエイティブソフトウェアに手頃なオプションを追加した。Adobe Photoshop のジェネレーティブ塗りつぶしと良い勝負で、ユーザにジェネレーティブ画像をリミックスする新鮮で楽しい方法を提供している。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する