Stability AI、Discord上で使える画像・動画生成AI「Stable Artisan」をローンチ

SHARE:
「Stable Artisan」を使った例。「エッフェル塔の周りでオリンピック開幕を祝う仏軍戦闘機」と入力。
Image credit: Masaru Ikeda

Stability AI は、テキストと動画コンテンツのための生成 AI 技術をついに Discord に導入する。

新しい Discord ボットサービス「Stable Artisan」が9日正式ローンチし、ユーザは Discord ボットを介して、Stable Diffusion 3(SD3)で画像を、Stable Video Diffusion(SVD)で動画を生成できるようになった。Discord をインターフェイスとして利用するというアイデアは、ライバルとなる AI 画像サービス Midjourney が2022年にデビューして以来持っていたものだ。

Stability AI は、開発者がアクセスできる API を通じて、そのコアとなる Stable Diffusion モデルへのアクセスを提供してきた。コアモデルについては、重み(編注:学習済みのパラメータ)は Hugging Face でも利用可能だった。今年の2月22日まで、Stable Diffusion はウェブサービス「Clipdrop」でも利用可能だったが、これは現在、AI スタートアップの Jasper が所有している。一方、Stable Video は、Stability AI が所有・運営する StableVideo.com のウェブサイトを通じて利用できる。

Stability AI の共同 CEO 兼 CTO  Christian Laforte(クリスチャン・ラフォルテ)氏は VentureBeat に次のように語った。

Stable Artisan の最初のローンチは、ユーザの行動を監視し、Discord ボットの現在の機能性と動作が、より多くの機能を追加し始める前に、我々の基準に達していることを確認する機会を与えてくれるでしょう。

会員以外も利用可能だが、利用料がかかる

Stable Artisan は有料サービスだが、まずは3日間の無料トライアルを試すことができる。

月額900クレジットのスタンダードプラン(9米ドル)から、月額1,200クレジットのプレミアムプラン(99米ドル)まである。

Stability AI の API は、画像生成の価値を決定するためにクレジットシステムを使用している。各 SD3画像は6.5クレジットであり、旧型ではあるが依然として有能な Stable Diffusion 画像コアモデルを使用した生成はわずか3クレジットである。動画は1生成あたり20クレジットである。

Laforte 氏によると、Stable Artisan にアクセスするには、ユーザは Stability AI のウェブサイトでアカウントを作成し、同社の Discord サーバに参加する必要がある。

Stability AI は、2023年末に発表した会員制度も持っている。Laforte 氏によると、Stable Artisan サービスは現在、Stability AI メンバーシップとはリンクしていないという。

Discord ボット「Stable Artisan」で何ができるか

「Stable Artisan」を使った例。「晴れの日曜日、手を振りながらレインボーブリッジを歩く少女」と入力。
Image credit: Masaru Ikeda

Stable Artisan は基本的な画像生成だけではない。いくつかの編集やカスタマイズ機能も備えている。このカスタマイズ機能は、Stability AI が以前ウェブサービス「Clipdrop」を運営していた時に提供していたものと多少似ている。

その機能には以下のようなものがある。

  • 検索と置換:このインペインティング・サービスでは、ユーザは簡単な言語プロンプトを使って画像内のオブジェクトを特定することができる。特定されたオブジェクトは自動的に分割され、マスクを必要とせずに、プロンプトで指定された要求オブジェクトに置き換えられる。
  • 背景の除去:この機能は、前景のコンテンツを保持しながら背景を削除する。
  • クリエイティブ・アップスケール:低解像度または低画質の画像を、最大解像度4K までアップスケールすることができる。
  • アウトペイント:アウトペイント・サービスは、任意の方向に追加の要素を挿入することにより、画像のコンテンツを拡張し、拡張されたスペースをシームレスに埋める。
  • コントロールスケッチ:手描きのラフスケッチを、正確なコントロールで高品質な画像に変換できる。
  • コントロールストラクチャ:入力画像の構造を維持したまま画像を生成できる機能。

次は Stable Assistant

新しい Stable Artisan サービスは、多くのユーザが Stability AI 画像生成モデルにアクセスするための、よりアクセスしやすい方法を提供するが、まだ続きがある。

ひとつは、少なくとも今日の時点では、Stable Artisan は Stable Audio へのアクセスを提供していない。先月、Stability AI は Stable Audio 2.0を発表した。これは現在、API および StableAudio.com のウェブサイトから入手できる。Stability AI には、Stable CodeStable LM など、コードやテキスト生成のためのモデルもあるが、いずれも Stable Artisan では利用できない。

しかし Stability AI は、Stable Assistant として知られる、より大きな会話チャットボットのアイデアに取り組んでいる。Stable Assistant はウェブベースのフレンドリーなチャットボットで、Stability AI の画像生成と大規模言語モデル(LLM)の技術を使い、自然言語での会話を通じ、さまざまなタスクでユーザを支援する。

どちらも Stability AI が積極的に開発しているアプリケーションで、異なるユーザグループに対応しています。(Laforte 氏)

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する