Google、画像解析が可能になった「Bard」最新版とAI支援ノートアプリ「NotebookLM」を公開

SHARE:

新しいジェネレーティブ AI 製品のニュースの津波が収まる気配がない。OpenAIが「Code Interpreter」を「ChatGPT Plus」の全ユーザに提供範囲を拡大し、Anthropic が「Claude 2」を発表した直後に、Google は今週2つの大きな AI 発表で再びスポットライトを浴びている。一つは、大規模言語モデル(LLM)製品「Bard」のメジャーアップデートで、ユーザが画像をアップロードして Bard に分析させることを可能にする。もう一つは、「Google NotebookLM」の発表で、このツールは AI を活用したノート作成サービスである。

Bard はグローバルに、そしてビジュアルに

新しくなった「Bard」
Image credit: Google

まずは Bard のアップデートについてだ。OpenAI が2022年11月に「ChatGPT」をリリースしてからしばらくの間、Google は AI への取り組みでキャッチアップを競っているように見えた。

しかし、2023年5月に開催された年次カンファレンス「Google I/O」はそれを一変させた。CEO のSundar Pichai 氏をはじめとする幹部やプレゼンターたちは、2時間にわたる基調講演の中で「ジェネレーティブ AI」という言葉を140回以上も口にし、まるでビジネス成功のための魔法の呪文のようだった。

明らかに、検索とウェブの巨人は、シリコンバレーと世界のハイテク業界を席巻している技術トレンドを心から受け入れていた。Bard は、Google I/O で広くリリースされて以来、ChatGPT のようなユーザ数に達することはできなかったが、最近ではその数をより劇的に増やしており、13日に発表された新しいアップデートは、その傾向をさらに助長するかもしれない。

13日発表された Google ブログの投稿は、Bardの 製品責任者 Jack Krawczyk 氏と Bard のエンジニアリング担当副社長 Amarnag Subramanya 氏の執筆によるもので、言語モデルの新機能の概要を次のように説明している。

  • 世界のほとんどの場所で利用できるよう、アラビア語、中国語、ドイツ語、ヒンディー語、スペイン語を含む40言語でのユーザプロンプトをサポートしている。Bard は、ブラジルやヨーロッパなど多くの新しい地域でもアクセス可能だ。
  • Bard は40言語で応答することができ、特に発音を学ぶのに有益だろう。
  • Bard は、ユーザの求めに応じて、シンプル、ロング、ショート、プロフェッショナル、カジュアルなど、異なるタイプで回答できるようにした。これらは何が違うのか? Google はこんな例を挙げている。

    ビンテージのアームチェアのマーケットプレイスへの出品を Bard に依頼し、ドロップダウンを使って回答を短くすることができる。

    この機能は、最初は英語のみで利用可能だが、グーグルは他の言語も追随するとしている。

  • 生産性を高める4つの新機能が発表された。Bard の会話をピン留めしたり、名前を変更したり、Python コードを Replit や Google Colab にエクスポートしたり、共有可能なリンクで回答をネットワークと共有したり、Google Lens との連携でプロンプトに画像を使ったりできる。特にピン留めは、Bard の会話から選択した回答をインターフェースのウィンドウの左側に保存し、後で簡単にアクセスできるようにするもので、一般的に便利だと思われる(回答を見つけるために上下にスクロールする代わりに)。
  • I/O の約束に続き、Bard は Google の画像認識技術「Google Lens」と連携され、ユーザはプロンプトに画像を含めることができるようになった。画像に関する詳細情報が必要な場合でも、キャプションの作成に支援が必要な場合でも、Bard はアップロードされた画像を分析して支援することができる。ブログ投稿時点では、この機能は英語で利用可能で、近々他の言語にも拡大する予定だ。しかしRedditでは、あるユーザがすでに Bard を使って Google の画像 CAPTCHA(「信号機のある四角をすべて選択せよ」)を解くことに成功しており、人類と AI の境界線がますます曖昧になりつつある世界に興味深いひねりを加えている。

ノートを取る未来?

「NotebookLM」
Image credit: Google

Google は12日、別の I/O  での発表が、社内での開発・使用から限定的な一般公開へと移行したことを明らかにした

I/Oで「Project Tailwind」として紹介されたこのサービスを、Google は「NotebookLM(「言語モデル 」の略)」と改名した。

Google の自称「小さな  NotebookLM チーム」が考えているように、メモの取り方は、紙に走り書きしたり、Apple のメモアプリで入力したりする標準的なものから、多くの異なるメモや文書間のつながりを自動的に分析・発見し、明確で読みやすいガイドにまとめることで改善される。NotebookLM はさらに進んで、ユーザのメモや文書に関する質問に会話形式で答えたり、ユーザが新しいコンテンツを作成する手助けをすることもできる。

Google Labs プロダクト・マネージャー Raiza Martin  氏は、このサービスを説明するGoogleのブログ記事で次のように書いている。

学生や教授、ナレッジワーカーと話をする中で、最大の課題のひとつは、複数のソースから事実やアイデアを連携することです。

また、同じ記事の中で、Google Labs  の編集マネージャー Steven Johnson 氏は次のように書いている。

欲しい情報源はあるが、つながりを作るのに時間がかかることが多い。

この問題に対する Google の解決策は、ユーザが選択したどのような文書群にもとづいて、〝地に足をつけた〟つまりユーザにパーソナライズされた 「バーチャルリサーチアシスタント」を作ることである。NotebookLM はこれらの文書を見て、独自のガイドを作成し、それをユーザに提示する。ユーザは、Bard のようなテキストからテキストへのプロンプトフィールドで、特定の側面に関する詳細情報や、基本的なコンテンツに基づく創造的なアイデアを求めることができる。

Google のブログ記事にはこうある。

医学生が神経科学に関する科学論文をアップロードし、NotebookLMに「ドーパミンに関連する重要な用語の用語集を作成してください」と指示することができます。

伝記を書いている作家は、研究ノートをアップロードして、「フーディーニとコナン・ドイルが交流したすべての回を要約してください」というリクエストができます。

また、YouTube クリエイターや TikTok インフルエンサーは、新しい動画のアイデアをアップロードして、「このトピックに関する短い動画のスクリプトを作成してください 」と依頼することができます。

NotebookLM は今のところアメリカ国内でのみ利用可能で、ウェイティングリスト制となっている。

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。
  • 会員限定記事・毎月3本
  • コミュニティDiscord招待
無料メンバー登録