NVIDIA が次世代の Blackwell GPU を発表、コストとエネルギー消費を25分の1に削減

SHARE:

Nvidia(エヌビディア)は、次世代の Blackwell(ブラックウェル)グラフィックス処理ユニット(GPU)を発表した。この GPU は、AI の処理タスクにおいて、エネルギー消費とコストを25分の1に削減する。

Nvidia GB200 Grace Blackwell Superchip は、複数のチップを同一パッケージに収めたものであり、LLM 推論ワークロードにおいて、以前のバージョンと比較して最大30倍の性能向上を実現する。

Nvidia GTC 2024 での基調講演で、Nvidia CEO の Jensen Huang(ジェンセン・ファン)氏は、数千人のエンジニアを前に、Blackwell がコンピューティングの変革をもたらす時代の幕開けになると述べた。ゲーム製品は後日発表される見込みだ。

基調講演の中で、Huang 氏は冗談交じりに、手に持っているプロトタイプは100億ドルと50億ドルの価値があると述べた。これらのチップは Grace Blackwell システムの一部だ。Huang 氏は次のように述べている。

「私たちは30年にわたって、ディープラーニングや AI のような変革をもたらすブレークスルーを可能にすることを目標に、アクセラレーテッド・コンピューティングを追求してきました。生成 AI は、私たちの時代を象徴する技術です。Blackwell GPU は、この新しい産業革命を推進するエンジンなのです。世界で最も活動的な企業と協力し、あらゆる産業において AI の約束を実現していきます」。

具体的な改善点について、Nvidia は、Blackwell ベースのコンピュータは、組織がリアルタイムの生成 AI を1兆パラメータの大規模言語モデル上で構築・実行することを可能にし、前世代の Hopper と比較して、コストとエネルギー消費を25分の1に削減できると述べている。処理は最大10兆パラメータの AI モデルまでスケールする。

これらの数値は、Nvidia が推論チップ設計の Groq(グロック)やハイエンド CPU ベンダーの Cerebras(セレブラス)、さらには AMD や Intel などからの競争に直面する中で重要だ。カリフォルニア州マウンテンビューに本拠を置く Groq は、AI 学習ではなく推論に特化したチップに注力するライバル企業だ。

Nvidia の Blackwell は、Hopper と比較して、大幅なコストとエネルギー効率の向上を実現している。

Blackwell は、アメリカ科学アカデミーに選出された最初の黒人学者である数学者の David Harold Blackwell(デイビッド・ハロルド・ブラックウェル)氏にちなんで名付けられ、Nvidia Hopper GPU アーキテクチャの後継となり、アクセラレーテッド・コンピューティングの新しい基準を打ち立てるものだ。

このプラットフォームは、データ処理、エンジニアリング・シミュレーション、電子設計自動化、コンピュータ支援創薬、量子コンピューティング、生成 AI など、さまざまな分野でブレークスルーを可能にする 6 つの先駆的なテクノロジーを導入している。

世界最強のチップ

生成 AI が Nvidia を Blackwell へと押し上げている。

Huang 氏は、Blackwell が世界で最も強力なチップになると述べた。2080億個のトランジスタを搭載した Blackwell アーキテクチャの GPU は、TSMC のカスタムビルトの2レチクル制限4NP プロセスを使用して製造されており、多くの処理能力を実現している。

Blackwell は、第2世代の Transformer Engine を搭載している。新しいマイクロテンソル・スケーリング・サポートと高度なダイナミック・レンジ管理アルゴリズムを備えた Transformer Engine は、革新的な4ビット浮動小数点 AI 推論機能により、計算能力とモデルサイズを2倍に拡張する。

また、Nvidia は第5世代の NVLink ネットワーキング・テクノロジーを発表した。数兆パラメータの AI モデルの性能を向上させるために、最新の NVLink は、GPU 当たりの双方向スループットを革新的に向上させ、シームレスな高速通信を実現する。

NVLink は、GPU 当たり 1.8TB/s の双方向スループットを提供し、最大576個の GPU 間でシームレスな高速通信を実現し、現在最も複雑な LLM に対応する。

また、RAS Engine を搭載している。信頼性、可用性、保守性を確保するために、Blackwell 搭載の GPU は、専用エンジンと AI ベースの予防保守機能を統合し、システムの稼働時間を最大化し、運用コストを最小限に抑える。

Nvidia の Blackwell チップは大規模サーバーシステムに搭載される。

また、セキュアな AI ソリューションも提供する。高度な機密コンピューティング機能により、パフォーマンスを損なうことなく、AI モデルと顧客データを保護し、プライバシーに敏感な業界のニーズに対応する。

最新のフォーマットをサポートしてデータベースクエリを高速化する専用の解凍エンジンにより、データ分析とデータサイエンスのパフォーマンスが向上し、データ処理に革命をもたらす。

このスーパーチップは、1.4エクサフロップスの AI 性能と 30TB の高速メモリを備えたラックスケール・システムである NVIDIA GB200 NVL72 の中核をなすものだ。

Amazon、Google、Meta、Microsoft、OpenAI などの主要クラウドプロバイダ、サーバーメーカー、大手 AI 企業での幅広い採用が見込まれる Blackwell プラットフォームは、あらゆる業界でコンピューティングに革命をもたらす可能性を秘めている。

Blackwell は、データ処理、エンジニアリング・シミュレーション、電子設計自動化、コンピュータ支援創薬、量子コンピューティング、生成 AI など、Nvidia にとって新たな業界の機会となるコンピューティング顧客をターゲットとする。

Nvidia GB200 Grace Blackwell Superchip は、2つの Nvidia B200 Tensor Core GPU を、900GB/s の超低電力チップ間リンクを介して Nvidia Grace CPU に接続する。GB200 Superchip は、LLM 推論ワークロードにおいて、Nvidia H100 Tensor Core GPU と比較して最大30倍の性能向上を実現し、コストとエネルギー消費を最大25分の1に削減する。

GB200 は、最も計算集約型のワークロード向けのマルチノード液冷ラックスケール・システムである Nvidia GB200 NVL72 の重要なコンポーネントだ。第5世代の NVLink で相互接続された36個の Grace Blackwell Superchip(72個の Blackwell GPU と36個の Grace CPU を含む)を組み合わせている。

さらに、GB200 NVL72 には、ハイパースケール AI クラウドにおけるクラウドネットワークの高速化、コンポーザブルストレージ、ゼロトラストセキュリティ、GPU コンピュートの弾力性を実現する Nvidia BlueField-3 データ処理ユニットが含まれている。このプラットフォームは、1.4エクサフロップスの AI 性能と 30TB の高速メモリを備えた単一の GPU として機能し、最新の DGX SuperPOD のビルディングブロックとなる。

Nvidia は、高速インターコネクトを介して8個の B200 GPU を接続するサーバーボード HGX B200 を提供し、世界で最も強力な x86 ベースの生成 AI プラットフォームをサポートする。HGX B200 は、Nvidia Quantum-2 InfiniBand と Spectrum-X イーサネット・ネットワーキング・プラットフォームを通じて、最大 400Gb/s のネットワーク速度をサポートする。

GB200 は、大手クラウドサービスプロバイダと共同設計された AI プラットフォームである Nvidia DGX Cloud でも利用可能になる予定だ。これにより、企業の開発者は、高度な生成 AI モデルの構築と展開に必要なインフラストラクチャとソフトウェアに専用アクセスできるようになる。AWS、Google Cloud、Oracle Cloud Infrastructure は、今年後半に Nvidia Grace Blackwell ベースのインスタンスをホストする予定だ。

Cisco、Dell Technologies、Hewlett Packard Enterprise、Lenovo、Supermicro は、Blackwell 製品をベースにした幅広いサーバーを提供する予定であり、Aivres、ASRock Rack、ASUS、Eviden、Foxconn、Gigabyte、Inventec、Pegatron、QCT、Wistron、Wiwynn、ZT Systems も同様だ。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する