NVIDIA、テキストから 3Dモデル を即座に生成「Latte3D」発表ーー仮想の3Dプリンタのようなもの

SHARE:
Latte3D generates 3D images from text prompts. Image Credit: Nvidia

Nvidia は、生成 AI を使用して文章から3Dシェイプを即座に生成する Latte3D を発表した。テキストから3Dへ変換するこの生成 AI モデルは、ミリ秒単位で高品質の3Dシェイプを生成できるのだ。

Nvidia のトロントにある AI 研究所チームによって開発された Latte3D は、シンプルなテキストプロンプトから3Dオブジェクトや動物をほぼリアルタイムで生成することができ、人工知能分野の大きな進歩を示すものであると Nvidia は述べている。

Nvidia の AI 研究担当副社長である Sanja Fidler(サンジャ・フィドラー)氏は、Latte3D をあらゆる業界のクリエイターにとってのゲームチェンジャーと称賛した。

「これにより、結果を1桁速く生成できるようになり、あらゆる業界のクリエイターにとって、テキストから3Dへのほぼリアルタイムの生成が手の届くところにきました」と Fidler 氏は声明の中で述べている。

Latte3D の中核は、テキストプロンプトを詳細な3D表現に変換する能力にある。それは、仮想の3Dプリンタのようなものだ。NVIDIA RTX A6000 などの単一のグラフィックス処理ユニット(GPU)を利用することで、このモデルは複雑な3Dシェイプを瞬時に生成することができ、時間のかかるレンダリング処理の必要性がなくなる。

クリエイターは、オブジェクトをゼロから労力をかけてデザインしたり、3Dアセットライブラリを探したりする代わりに、Latte3D に頼ることで、自分のアイデアを速やかに、効率的に実現できるようになった。このモデルは、各テキスト入力に基づいて複数のシェイプオプションを提供し、ユーザーは自分のニーズに最適なデザインを選択できる。

この分野の多くの専門家と話をしたが、彼らは、生成画像を修正して、まさに望んでいるものにするのは本当に難しいと懸念している。コンセプトを生成するのは簡単だが、そのコンセプトを言葉で望むものに成形するのが難しい課題なのだ。

Latte3D の汎用性は、動物や日用品などの初期トレーニングデータセットを超えて拡張される。開発者は、さまざまなタイプのデータでモデルをトレーニングすることができ、ランドスケープデザインやロボット工学など、さまざまな分野でのアプリケーションを可能にする。

ランドスケープデザイナーにとって、Latte3D は庭のレンダリングを本物そっくりの葉で埋めるプロセスを迅速化できる一方で、ロボット工学の開発者は、パーソナルアシスタントロボットをトレーニングするために家庭環境をシミュレートするためにこのモデルを使用できる。

NVIDIA A100 Tensor Core GPU を搭載し、ChatGPT を使用して生成された多様なテキストプロンプトでトレーニングされた Latte3D は、Nvidia が AI 主導のコンテンツ作成ツールの進歩に注力していることを示している。幅広いテキスト記述を処理するこのモデルの能力は、ユーザーのニーズに合わせた正確で応答性の高いシェイプ生成を保証する。

Nvidia リサーチが AI とコンピュータグラフィックスの限界に挑み続ける取り組みの一環として、Latte3D は同社のイノベーションへの献身を示すものだ。世界中に何百人もの科学者とエンジニアを擁する Nvidia は、AI、コンピュータビジョン、自動運転車、ロボット工学の進歩を引き続き推進している。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する