マイクロソフト、Copilotに画像機能と新AIモデル「Deucalion」を追加——スーパーボウルのCMでも注目集める

SHARE:
デザイン変更された Microsoft Copilot(2024年2月)
Image credit: Microsoft

Microsoft は7日、web 上での AI 検索・チャットボット体験「Copilot」(旧名称 Bing Chat)の外観を一新し、AI による画像作成・編集機能を新たに内蔵したほか、Copilot の1つのバージョンに搭載される新しい AI モデル「Deucalion」を発表した

さらに、ワシントン州レドモンドに本社を置くソフトウェアとクラウドの巨人は、今度の日曜日に行われるプロフットボール「NFL スーパーボウル」のカンザスシティ・チーフスとサンフランシスコ・ジャイアンツの優勝決定戦で放映される新しいビデオ広告を発表した

Microsoft は、web 上の Copilot のランディングページを、より多くの空白とより少ないテキストですっきりとした外観にし、また、ユーザが作ることができるものの例として、さまざまな AI が生成した画像と、ユーザがそれらを生成するために入力することができる「プロンプト」または命令のサンプルを示す「カード」のビジュアルカルーセルの形で、多くの画像を追加した。

以下は、旧 Bing Chat と新 Microsoft Copilot のデザインを比較するための画像だ。

Bing Chat の初期デザイン(2023年7月)
Image credit: Microsoft

新しい Copilot は、copilot.microsoft.com と iOS および Android アプリストアの Copilot アプリですべてのユーザが一般に利用可能だが、AI 画像生成機能は今のところ、アメリカ、イギリス、オーストラリア、インド、ニュージーランドの英語版で利用できる。

AI スーパーボウル広告

スーパーボウルはもちろん、毎年世界とアメリカで最も広く視聴されるスポーツイベントのひとつであり、その期間中に全国的に広告を放映するための料金は、わずか30秒ほどの短いスポットであっても数百万米ドル以上する。

Microsoft が最近、時価総額で世界一とは言わないまでも、最も価値のある企業の1つであることを考えると(首位の座は定期的に変動する)、これは Microsoft にとってそれほど大きなコストではないが、同社が Copilot の名前と、より一般的な技術としての生成 AI との関連付けを強化し、平均的なアメリカ住民の口語表現を使うなら「メインストリート」に、web 検索には例えば Google ではなく Copilot を使うべきだと納得させることに、どれほど真剣に取り組んでいるかを示している。

実際、この広告を見ると、映画の脚本のシーンの「絵コンテ画像の生成」や、「3D オープンワールドゲームのコード生成」に Copilot を使っている人たちがいるのがわかる。

Microsoft からのメッセージは明確だ。Copilot は検索だけでなく、コンテンツやソフトウェアの作成まで行ってくれるのだ。

抵抗勢力やディープフェイクに負けず、コンテンツ制作を重視

多くの俳優、脚本家、パフォーマー、ミュージシャン、VFX アーティスト、そしてゲームメーカーまでもが、AI に仕事の機会を奪われることに公然と抵抗し、さらなる保護を訴えている今、エンターテインメント業界をターゲットにしたことは注目に値する。Microsoft の追記は、こうした異論をかなり明確かつきれいに一蹴し、Copilot と AI 全般を新進気鋭の努力家のためのクリエイティブなツールとして位置づけていると私は見ている。

Microsoft が新しい AI 画像生成・編集機能を Copilot に直接導入していることも注目に値する。リリースによると、Designer AI アートジェネレーターを搭載しており、OpenAI の DALL-E 3画像生成 AI モデルが ChatGPT に組み込まれているのと同様だ。

Microsoft が OpenAI に多額の投資とサポートをしているおかげで、Designer AI ももちろん DALL-E 3を搭載している。Microsoft のニュースリリースでは、エグゼクティブ・バイスプレジデント兼コンシューマー・マーケティング・チーフ Yusuf Mehdi 氏が次のように述べている。

Copilot の Designer を使えば、単に画像を作成するだけでなく、生成した画像を Copilot 内でインライン編集してカスタマイズできるようになり、チャットの流れを維持できます。オブジェクトを強調してポップな色にしたり、画像の背景をぼかして被写体を輝かせたり、ピクセルアートのような別のエフェクトで画像を再構築したり、Copilot ならすべて無料でできます。 Copilot Pro をご契約の方は、上記に加えて、チャットから離れることなく、画像を正方形と横長の間で簡単にリサイズして再生成できるようになりました。最後に、Copilot 内に新しい Designer GPT を近々展開する予定です。Copilot 内に没入感のある専用キャンバスを提供し、そこでアイデアを視覚化することができます。

先月末、ミュージシャンの Taylor Swift(テイラー・スウィフト)氏(NFL 選手のボーイフレンドを応援するためにスーパーボウルに登場する予定)のディープフェイクが、Microsoft の 生成 AI「Designer」作成されたとされ、ソーシャルプラットフォームや web 上に出回った。そしてそれは、少なくともアメリカの高校でディープフェイクのスキャンダルが起きた後のことだった。

Microsoft は、AI が悪用されているという批判には無関心であり、AI の使用や OpenAI との提携をめぐって様々な関係者から訴訟連邦捜査を受けていることにも無関心である。

新たな AI モデル「Deucalion」の出現

今日の発表の中に埋もれていた(実際にはリリース自体にも記載されていなかったが)事実は、Microsoft が Copilot の1つのバージョンのボンネットの下に新しい AI モデルを追加したということだ: Deucalion だ。

Microsoft コーポレートバイスプレジデント兼 Copilot および Bing エンジニアリング責任者 Jordi Ribas 氏の X(旧 Twitter)への投稿によると、同社は「Deucalion を出荷しました。Balancedモードを(中略)よりリッチで高速にするために微調整されたモデルです。」と述べている。

我々はまた、@Microsoft Copilot の Balancedモードをよりリッチで高速にする微調整されたモデルである Deucalion を完全に出荷しました。

「Balanced モード」とは、Copilot が生成できる結果の中間カテゴリーを指す。ユーザは、Copilot(以前は Bing Chat)からの応答に対して「Creative」「Balanced」「Precise」のいずれかのモードを選択することができる。

しかし、「Creative」モードは、特定の事実ではなく、その名の通り、架空の世界構築、執筆、デザインなど、創造的でオープンエンドなプロジェクトの手助けを求めている人にはより効果的だ。

学校や仕事でリサーチをする場合は、「Precise」と「Balanced」モードがよいだろう。もちろん、「Balanced」は、その名の通り、ユーザに創造性と正確さ・事実に基づいた回答の両方を同等に提供しようとするものだ。

さて、大きな問題は Deucalion が何をベースにしているかということだ。Bing Chat 自体は、ChatGPT Plus/Team/Enterprise の基盤モデルである OpenAI の GPT-4によって駆動されており、GPT-4 と GPT-4 Turbo/V が引き続き Copilot を駆動しているのは当然である。

しかし、Deucalion は GPT-4をベースにしているのか、それとも別のモデル、例えば Microsoft の Phi-2をベースにしているのか?Ribas 氏が「微調整されたモデル」と述べていることから、Microsoft のエンジニアが彼らの目的のためにさらに微調整した GPT-4のバージョンだと思われる。OpenAI のドキュメントによれば、GPT 4の微調整をサポートしている

Deucalion のドキュメントは私が見た限りではかなり少ないが、Microsoft の広告・web サービス担当 CEO Mikhail Parakhin 氏は先週、同社が Deucalion をテスト中であること、ギリシャ神話のプロメテウスの息子にちなんで名付けられたことを X に投稿した。

われわれは Microsoft Copilot を継続的に改良しており、ベースモデルの新バージョンをフライトでテストしています。面白い事実:内部名称は「Deucalion」(ギリシャ神話のプロメテウスの息子)です。

Mikhail 氏の X の投稿/ツイートにあるように、実はこれはサードパーティの Windows 開発者であり技術インフルエンサーの Vitor de Lucca 氏への返答であり、彼は Copilot の Balanced モードで提供される回答が「より良く」「より大きい」ことに気づいた。

Copilot の Deucalion モデルフライトの別の例、フライトあり :)

https://twitter.com/vitor_dlucca/status/1753954923878682713

de Lucca 氏はさらに昨日、新しい Deucalion を搭載した Balanced モードからの翻訳能力も Creative モードより優れていると X に投稿した。

Balanced に搭載された新しい Bing Deucalion は、Creative よりも翻訳にも優れている(笑)

https://twitter.com/vitor_dlucca/status/1755018240588238982

私たちは Microsoft の広報担当者に連絡を取り、Ribas 氏にツイートし、より詳しい情報を求めている。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する