Midjourney競合のIdeogram、8,000万米ドルをシリーズA調達——a16zがリード

SHARE:
Image credit: Ideogram

Marc Andreessen 氏とメガ VC の Andreseen Horowitz (a16z)の同胞たちは、Google Gemini の人種差別的な AI 画像への不満から一転、ライバルの画像生成スタートアップ Ideogram への投資額を増やし、同社の8,000万米ドルのシリーズ A 資金調達をリードしたと、両社が2月28日に発表した。

さらに、a16z のジェネラルパートナー Martin Casado 氏が Ideogram の取締役会に加わり、同社のブログ投稿によると、同社は2月28日、ゼロから訓練された画像生成モデルの新バージョン「Ideogram 1.0」を発表した。

Ideogram 1.0は現在、同社のサイトで無料で試用できるが、ログインには Google または Apple のアカウントが必要だ。また、同社の Discord サーバから画像を生成することもできる。

同社は、1日あたり100枚を上限とする無料プランと、1日あたり400枚を上限とする月額プラン(月額7米ドル、年払のベーシックプラン)、1日あたり無制限プラン(月額16米ドル、年払のプラスプラン)を提供している。

Ideogram の8,000万米ドルのシリーズ A ラウンドには、先行投資家の Index Ventures、新規投資家の Redpoint Ventures、Pear VC、SV Angel も参加している。同社のシードラウンドは a16z がリードし、AIX Ventures、Golden Ventures、Two Small Fish Ventures、業界専門家の Ryan Dahl 氏、Anjney Midha 氏、Raquel Urtasun 氏、Jeff Dean 氏、Sarah Guo 氏、Pieter Abbeel 氏、Mahyar Salek 氏、Soleio 氏、Tom Preston-Werner 氏、Andrej Karpathy 氏 が参加した。

AI 画像におけるテキストやタイポグラフィの生成は、もはや独自の差別化機能ではない

元 Google Brain の AI 研究者によって設立された Ideogram は、2023年8月に初めてデビューしたとき、AI が生成した画像に直接テキストやタイポグラフィを埋め込んで提供することで話題を呼んだ。

しかし、その後、Midjourney が V6のリリースの一環として画像内にテキスト生成を導入しただけでなく、OpenAI の DALL-E 3もユーザにこの機能を導入(ChatGPT 経由でアクセス可能)するなど、ゲームは大きく変化している。例えば、メッセージが印刷された看板を掲げるキャラクターや、読みやすい看板のある店先などを AI 画像として生成させることが可能だ。

現在では、多くの AI 画像ジェネレーターによって文字の形成がより身近になったため、Ideogram の差別化要因は少なくなっている。それでも、結果は常に一貫しているわけでも、ユーザが促したものと一致しているわけでもない。Ideogram は、1.0と本日(2月28日)のシリーズ A を発表したブログポストで、人間の評価者が Midjourney V6や DALL-E 3よりも Ideogram を好むという調査結果を指摘している。 これらの資金調達を裏付ける以下のグラフをご覧いただきたい:

ユーザがどの生成 AI を好むかを DALL-E 3、Midjourney V6と比較した Ideogram のグラフ
Credit: Ideogram

しかし、Ideogram は、「3D レンダリング、シネマティック、ペインティング、ファッション、プロダクト、イラストレーション、コンセプチュアル・アート、浮世絵」のような、事前にキュレーションされた画像スタイルから選択できる機能をユーザに提供することで、最初のローンチの際にも際立っていた。現在、ウェブサイトはさらに進化し、さまざまなアスペクト比、画像の重さ、他の Ideogram ユーザへの世代の公開/非公開、新しいマジック・プロンプト機能(この記事のさらに下に記載)をオンにするトグルなどのオプションが追加されている。

だが Ideogram は依然として新機能で際立とうとしている

Ideogram はその地位に甘んじているわけでもない。同社の最新機能であるマジック・プロンプトは、ユーザが入力したテキスト・プロンプトを自動的に拡張して、より説明的で詳細なものにし、理想的な高品質の画像を作成する。

しかし、この機能もまた、OpenAI の画像生成 AI の DALL-E 3と ChatGPT の統合に似ており、ユーザのテキストプロンプトを受け取り、より生き生きとした新しい説明的な言葉で自動的に修正する。

これらの機能は、ユーザが試行錯誤をすることなく(我々の経験では、試行錯誤も必要だが)、ユーザが書いたものをより機械が理解しやすい形式に効果的に翻訳し、基礎となる AI モデルとユーザがより良いコミュニケーションをとる手助けをするという点で理にかなっている。

急成長する AI アートのコミュニティや、潜在的な企業ユーザやマーケティング担当者にとっては、間違いなくエキサイティングなことだが、Ideogram 1.0の登場と、製品を構築するための継続的な資金調達は、最近の例が示すように、すでにウェブ上で深刻化している問題である、スパム的な AI 画像生成の増加にもつながりそうだ。

VentureBeat は、Ideogram、Midjourney、DALL-E 3、その他の AI ツールを使って記事画像を作成している。

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。
  • 会員限定記事・毎月3本
  • コミュニティDiscord招待
無料メンバー登録