数時間前(訳註:原文は公開日が5月14日の発報当日)に OpenAI took the wrapper off its newest AI large language model ( LLM ) として GPT-4o ( Omni の略)を発表したばかりだが、すでにイベントと技術に対する初期の反応が寄せられている。
現段階では反応は混在していると言える。 OpenAI の短い( 26 分間の)デモプレゼンテーションからもっと知りたいと感じた人もいる一方で、同社はその後 a plethora of video demos と more information を公開している。新しい基盤モデルについては、前のフラグシップモデルである GPT-4 モデルよりも速く、サードパーティーの開発者にとってより手頃になった。そして何よりも重要なのは、音声を通じて主に人間の表情を検出し模倣する能力が向上しているという点だ。
このモデルは、 ChatGPT を通じて全てのユーザー、つまり非購読者も含めて無料で利用できる。ただし、購読者は優先的にアクセスできる(アップデートは今後数週間で展開予定)。また、最初はテキストとビジョンの機能のみで、音声とビデオは数週間後に追加予定である。
GPT-4o は、テキスト、音声、視覚データを等しく扱い、すべてをトークンに変換するようにゼロから訓練されており、従来のようにすべてをテキストに変換することに依存しない。これにより速度が向上し、コストが削減されている。
ここで、ネット上の反応を紹介する:
「 OpenAI は、 Character AI の形式と大規模な配信チャネルをほぼ 100 %重ねる形で、彼らのお株を奪っている」と Nvidia senior research manager and AI influencer Jim Fan (ジム・ファン氏)は X (旧 Twitter )で書いている。「これは、強い個性を持つ感情的な AI への方向転換であり、 OpenAI は過去にこれを積極的に抑制しようとしていたようだ」。
I know your timeline is flooded now with word salads of "insane, HER, 10 features you missed, we're so back". Sit down. Chill. <gasp> Take a deep breath like Mark does in the demo </gasp>. Let's think step by step:
– Technique-wise, OpenAI has figured out a way to map audio to… pic.twitter.com/3fL9n8Mtch
— Jim Fan (@DrJimFan) May 13, 2024
「 GPT-4o は大きな飛躍ではない」と ペンシルバニア大学ウォートン・スクール教授でAIインフルエンサーの Ethan Mollick (イーサン・モリック氏)は述べている。
GPT-4o isn't the big leap. This is. https://t.co/HctlZtYyOw
— Ethan Mollick (@emollick) May 13, 2024
同じく AI インフルエンサーでスタートアップアドバイザーの Allie K. Miller (アリー・ケイ・ミラー氏)は、 macOS (後に Windows )向けの新しいデスクトップ ChatGPT アプリに興奮している。彼女は X で次のように書いている:
「 HOLY MOLY THIS IS THE WINNING FEATURE. これは基本的に 24 / 7 でスクリーンシェアする同僚のようなものだ、疲れもなく。これを使って何時間も連続で働く人が出てくるだろう」。
113,000 people joined live to watch the OpenAI new spring release livestream.
Now, I’ll tell you right off the bat, the social media response (based on MY feed) is mixed. The super techies are disappointed that they don’t have some holographic laser beam that shoots out of their…
— Allie K. Miller (@alliekmiller) May 13, 2024
AI 開発者の Benjamin De Kraker (ベンジャミン・デ・クラカー氏)は、これが本質的に汎用人工知能(AGI)であり、ほとんどの人間を凌駕し、経済的に価値のあるタスクのほとんどを遂行できる AI であると信じていると書いている。これは、 OpenAI の全体の目標であり存在理由でもあった。
「 Alright I’m gonna say it… This is essentially AGI. これは一般大衆にとって魔法のように見えるだろう。仮想の『人』がほぼ平均的な人間と区別なく聞き、話し、見て、推論できるとき、何と呼ぶべきか?」
Alright I'm gonna say it… This is essentially AGI.
This will be seen as magic to masses. What else do you call it when a virtual "person" can listen, talk, see, and reason almost indistinguishably from an average human?
Isn't that AGI? https://t.co/geMZx8BFjE
— Benjamin De Kraker 🏴☠️ (@BenjaminDEKR) May 13, 2024
開発者の Siqi Chen (シーキ・チェン氏)も同様に感銘を受けており、 X に「これは振り返ってみると最も過小評価されている OpenAI のイベントになるだろう」と書いている。
this will prove to be in retrospect by far the most underrated openai event ever
openai casually dropping text to 3d rendering in gpt4o and not even mentioning it
(more 👇🏼) pic.twitter.com/dQ6bq3cV4J
— Siqi Chen (@blader) May 13, 2024
反対に、ジャーナリストで作家の James Vincent (ジェームズ・ヴィンセント氏)は、 GPT-4o を声のアシスタントとしてマーケティングすることは「巧妙」だが、最終的には「知性の仮面をかぶっている」と述べ、「声は…必ずしも能力の飛躍を示すわけではない」としている。
OpenAI emphasising voice interaction for gpt-4o is canny and somewhat telling – they’re leaning into the masquerade of intelligence, voice is emotive and seductive (and they do it incredibly well) but it doesn’t necessarily indicate leaps forward in capability
— James Vincent (@jjvincent) May 13, 2024
同様に、著名な市場調査およびコンサルティング会社 Gartner の量子技術、 AI インフラストラクチャおよびスーパーコンピューティング部門の副社長 Chirag Dekate (チラグ・デカテ氏)は、 VentureBeat との電話インタビューで、 GPT-4o の発表イベントと技術デモが「少し失望したものであり、3カ月前に Google から見た Gemini デモを思い出させた」と述べている。
彼は、 OpenAI と Google 、 Meta 、さらには同盟関係にある Microsoft のような長年の技術企業との間に「能力のギャップ」が生じつつあると信じており、これらの企業は新しいモデルをトレーニングするためのより多くの生データを持ち、それらを展開するための多くの配信チャネルを持っており、 AI トレーニングと推論を最適化するためのクラウドインフラストラクチャとハードウェア( Google の場合は Tensor Processing Unit または TPU )も持っていると述べている。
「 Open AI は、同じような好循環を引き起こすのに苦労するだろう」と、 Dekate 氏は VentureBeat に語っている。
自称ルーディット(反技術)インフルエンサーの Artisanal Holdout (アルティザナル・ホールドアウト氏)は、私が見た中で最も辛辣な反応を X に投稿していた(驚くべきことではない):
「 Yikes — OpenAI は GPT-5 を躊躇し、代わりに GPT-4o を GPT-4 の初期リリースから 1 年以上経ってリリースした。彼らの開発の小さな一歩に自信が持てなかったようだ。 OpenAI と AI 兄弟の両方にとって恥ずかしいことだ。」
Yikes—OpenAI balked on GPT-5 and instead released GPT-4o over a year after the initial launch of GPT-4.
Guess they aren’t confident enough in their tiny baby steps of development. How embarrassing for both OpenAI and AI bros alike.
— Artisanal Holdout (@chiefluddite) May 13, 2024
一方、持株会社 Late Checkout の CEO である Greg Isenberg (グレッグ・イゼンバーグ氏)は、 X に「変化のペースは信じられない」と書いている。
Let me get this straight…
OpenAI dropped a new update today. They're calling it GPT-4o
GPT-4o (bad name btw) is 2x as fast as the last model, GPT-4 Turbo. And it costs half as much. And it recognizes audio and video.
Remember, GPT-4 launched in March 2023
So, in just about…
— GREG ISENBERG (@gregisenberg) May 13, 2024
AI 教育者の Min Choi (ミン・チョイ氏)もまた、このリリースを称賛しており、「 AI アシスタントのゲームを完全に変えるだろう」と述べている。
This is wild.
OpenAI just dropped ChatGPT-4o and it will completely change the AI assistant game.
10 wild examples:
1. Visual assistant in real-timepic.twitter.com/D3qWzHGzaD
— Min Choi (@minchoi) May 13, 2024
まだ公開されてから 1 日も経っておらず、多くの機能がまだ一般に公開されていないが、 GPT-4o は非常に若い製品である。しかし、すでに情熱的な反応が寄せられていることから、 OpenAI が多いに市場を刺激したことは明らかである。
VentureBeat も私の個人アカウントを通じてアクセスを受けており、今後数日間で新しいモデルをテストする予定である。試してみた結果をお楽しみに。
【via VentureBeat】 @VentureBeat
Members
BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。無料で登録する