Meta、FacebookやInstagramの写真で学習させたAI画像ジェネレーター「Imagine」をローンチ - BRIDGE（ブリッジ）テクノロジー＆スタートアップ情報

Facebook、Instagram、Whatsapp、Quest VR の親会社で、代表的なオープンソースの大規模言語モデル（LLM）「Llama 2」の開発元でもあるクリエーターの Meta Platformsは、文字列から画像への AI ジェネレーターゲームに参入している。

実は、はっきりさせておきたいことがある。Metaは、今年初めに Facebook と Instagram のメッセンジャー内で開始された文字列から画像、文字列からスタンプを生み出すジェネレーターを通じて、すでにそのゲームに参加していた。しかし今週、同社はメッセージングプラットフォームの外で、独立した文字列から画像を生み出す AI ジェネレーターサービス「Imagine」を開始した。

Meta の Imagine は現在、web サイトにアクセスするだけで画像を生成できる。Meta または Facebook／Instagramのアカウントでログインする必要がある（私は Facebook を試したが、新しい「Metaアカウント」を作成するよう強制された）。

初期の反応はさまざま

すでに web 上の AI アーティストたちは、Meta Imagine を使って高品質な画像を迅速かつ一貫して生成する実験を行っており、Midjourney、Stable Diffusion、OpenAI の「DALL-E 3」といった他の人気 AI 画像ジェネレーターと比較する声もある。

https://twitter.com/itsPaulAi/status/1732795557394223124

VentureBeat の簡単で非科学的なテストによると、リアルな人体や構造物を生成するのはまれで、多くの場合、私たちの画像には「溶けた」体の一部や風景のような奇妙な不具合が含まれていた。

MetaのImagine AIが生成した画像例。
Credit: VentureBeat/Meta

Imagine のインターフェイスは極めてミニマルだ。プロンプト欄と、ユーザがダウンロードできる4つの生成画像だけで、メッセンジャーアプリでは利用できるが、リミックスのオプションはない。

また、アスペクト比1:1の正方形を超えて画像のサイズを変更する方法もない。プロンプトに異なるアスペクト比を入力しても、生成された画像のアスペクト比は変わらなかった。

すべての画像には、右下隅に「Imagine」と書かれた透かしとシンボルのロゴが含まれている。

Meta の広報担当者は VentureBeat のメールに、「今後数週間のうちに、これらの AI が生成した画像の透明性と追跡可能性を高めるために、目に見えない透かしを追加します」と書いている。

とはいえ、Metaは既存の AI アートジェネレーター（その多くは有料のサブスクリプションを必要とする）に対抗する機能的で無料の競合製品を提供しようとしているようだ。

Metaがその基礎となるモデルを開発する際にアクセスすることができた膨大なトレーニングデータ、特に人物のデータを考えれば、それは理にかなっている。

「Emu」上で構築、ユーザが作成した Facebook や Instagram の画像で訓練

Meta の Imagine サービスは、Ars Technica が指摘し、Meta のエンジニアが9月に発表した「Emu」の研究論文で開示されているように、11億枚の Facebook と Instagram のユーザ写真で訓練された Emu と呼ばれる独自の AI モデルに基づいて構築されている。

ロイターの以前の報道では、Meta はプライベートなメッセージや、サービス上で公に共有されていない画像を除外していると指摘している。

他の競合 AI アートジェネレーターは、モデルを訓練するために公共の web からアート作品をスクレイピングしているとして、非難の的となっており、著作権侵害の疑いで集団訴訟にも直面している。しかし、写真を投稿した人々がこのような使い方を意図していなかったという批判を止めることはできないだろう。

Outrageous! Meta released a gAI model trained on 1.1 billion images from FB and IG. Copyrighted works, our pictures and our loved ones pictures all used to train this model.

Tech companies are claiming ownership of things they do not own! This MUST stop!https://t.co/7j2diEjO47 pic.twitter.com/IXoyHdss5h

— Karla Ortiz (@kortizart) December 7, 2023

Emu を開発する際、Meta の研究者たちは品質指標を中心に微調整も行った。彼らは論文でこう書いている。

我々の重要な洞察は、品質チューニングを効果的に行うには、生成可能な視覚的概念という点で、モデルの一般性を損なうことなく、生成された画像の美観に大きな影響を与えるには、驚くほど少量（数千）で十分であるということである。

興味深いことに、Meta はオープンソース AI を声高に支持しているにもかかわらず、Emu も Imagine by Meta AI サービスもオープンソースではないようだ。なぜオープンソースでないのか、また今後オープンソースになるのか、同社に問い合わせている。

Imagine の展開は、Facebook Messenger や Instagram のメッセージ内で AI が生成した画像を「長押し」し、文字列プロンプトに基づいて新しい画像を作成できる「reimagine」機能など、Meta が同社のアプリ群全体で行っている新しい AI 対応機能のアップデートの一部である。

【via VentureBeat】 @VentureBeat

【原文】