「ほぼ」AGI と称賛の一方、失望の声もーーGPT-4o ファーストインプレッションの数々

SHARE:
Credit: VentureBeat made with Midjourney V6

数時間前(訳註:原文は公開日が5月14日の発報当日)に OpenAI took the wrapper off its newest AI large language model ( LLM ) として GPT-4o ( Omni の略)を発表したばかりだが、すでにイベントと技術に対する初期の反応が寄せられている。

現段階では反応は混在していると言える。 OpenAI の短い( 26 分間の)デモプレゼンテーションからもっと知りたいと感じた人もいる一方で、同社はその後 a plethora of video demosmore information を公開している。新しい基盤モデルについては、前のフラグシップモデルである GPT-4 モデルよりも速く、サードパーティーの開発者にとってより手頃になった。そして何よりも重要なのは、音声を通じて主に人間の表情を検出し模倣する能力が向上しているという点だ。

このモデルは、 ChatGPT を通じて全てのユーザー、つまり非購読者も含めて無料で利用できる。ただし、購読者は優先的にアクセスできる(アップデートは今後数週間で展開予定)。また、最初はテキストとビジョンの機能のみで、音声とビデオは数週間後に追加予定である。

GPT-4o は、テキスト、音声、視覚データを等しく扱い、すべてをトークンに変換するようにゼロから訓練されており、従来のようにすべてをテキストに変換することに依存しない。これにより速度が向上し、コストが削減されている。

ここで、ネット上の反応を紹介する:

「 OpenAI は、 Character AI の形式と大規模な配信チャネルをほぼ 100 %重ねる形で、彼らのお株を奪っている」と Nvidia senior research manager and AI influencer Jim Fan (ジム・ファン氏)は X (旧 Twitter )で書いている。「これは、強い個性を持つ感情的な AI への方向転換であり、 OpenAI は過去にこれを積極的に抑制しようとしていたようだ」。

「 GPT-4o は大きな飛躍ではない」と ペンシルバニア大学ウォートン・スクール教授でAIインフルエンサーの Ethan Mollick (イーサン・モリック氏)は述べている。

同じく AI インフルエンサーでスタートアップアドバイザーの Allie K. Miller (アリー・ケイ・ミラー氏)は、 macOS (後に Windows )向けの新しいデスクトップ ChatGPT アプリに興奮している。彼女は X で次のように書いている:

「 HOLY MOLY THIS IS THE WINNING FEATURE. これは基本的に 24 / 7 でスクリーンシェアする同僚のようなものだ、疲れもなく。これを使って何時間も連続で働く人が出てくるだろう」。

AI 開発者の Benjamin De Kraker (ベンジャミン・デ・クラカー氏)は、これが本質的に汎用人工知能(AGI)であり、ほとんどの人間を凌駕し、経済的に価値のあるタスクのほとんどを遂行できる AI であると信じていると書いている。これは、 OpenAI の全体の目標であり存在理由でもあった。

「 Alright I’m gonna say it… This is essentially AGI. これは一般大衆にとって魔法のように見えるだろう。仮想の『人』がほぼ平均的な人間と区別なく聞き、話し、見て、推論できるとき、何と呼ぶべきか?」

開発者の Siqi Chen (シーキ・チェン氏)も同様に感銘を受けており、 X に「これは振り返ってみると最も過小評価されている OpenAI のイベントになるだろう」と書いている。

反対に、ジャーナリストで作家の James Vincent (ジェームズ・ヴィンセント氏)は、 GPT-4o を声のアシスタントとしてマーケティングすることは「巧妙」だが、最終的には「知性の仮面をかぶっている」と述べ、「声は…必ずしも能力の飛躍を示すわけではない」としている。

同様に、著名な市場調査およびコンサルティング会社 Gartner の量子技術、 AI インフラストラクチャおよびスーパーコンピューティング部門の副社長 Chirag Dekate (チラグ・デカテ氏)は、 VentureBeat との電話インタビューで、 GPT-4o の発表イベントと技術デモが「少し失望したものであり、3カ月前に Google から見た Gemini デモを思い出させた」と述べている。

彼は、 OpenAI と Google 、 Meta 、さらには同盟関係にある Microsoft のような長年の技術企業との間に「能力のギャップ」が生じつつあると信じており、これらの企業は新しいモデルをトレーニングするためのより多くの生データを持ち、それらを展開するための多くの配信チャネルを持っており、 AI トレーニングと推論を最適化するためのクラウドインフラストラクチャとハードウェア( Google の場合は Tensor Processing Unit または TPU )も持っていると述べている。

「 Open AI は、同じような好循環を引き起こすのに苦労するだろう」と、 Dekate 氏は VentureBeat に語っている。

自称ルーディット(反技術)インフルエンサーの Artisanal Holdout (アルティザナル・ホールドアウト氏)は、私が見た中で最も辛辣な反応を X に投稿していた(驚くべきことではない):

「 Yikes — OpenAI は GPT-5 を躊躇し、代わりに GPT-4o を GPT-4 の初期リリースから 1 年以上経ってリリースした。彼らの開発の小さな一歩に自信が持てなかったようだ。 OpenAI と AI 兄弟の両方にとって恥ずかしいことだ。」

一方、持株会社 Late Checkout の CEO である Greg Isenberg (グレッグ・イゼンバーグ氏)は、 X に「変化のペースは信じられない」と書いている。

AI 教育者の Min Choi (ミン・チョイ氏)もまた、このリリースを称賛しており、「 AI アシスタントのゲームを完全に変えるだろう」と述べている。

まだ公開されてから 1 日も経っておらず、多くの機能がまだ一般に公開されていないが、 GPT-4o は非常に若い製品である。しかし、すでに情熱的な反応が寄せられていることから、 OpenAI が多いに市場を刺激したことは明らかである。

VentureBeat も私の個人アカウントを通じてアクセスを受けており、今後数日間で新しいモデルをテストする予定である。試してみた結果をお楽しみに。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する