DBベンダのRocksetが4,400万米ドル調達、生成AI時代の需要に応えリアルタイムインデックス機能強化へ

SHARE:
Rockset 共同創業者の人。左から、CEO の Venkat Venkataramani 氏、CTO の Dhruba Borthakur 氏
Image credit: Rockset

データベースベンダの Rockset は、ジェネレーティブ AI の時代にリアルタイムインデックス機能への需要が高まっていることを受けて、新たに4,400万米ドルの資金を調達する。

今回の資金調達はシリーズ B ラウンドに続くもので、カリフォルニア州サンマテオを拠点とする同社のこれまでの資金調達総額は1億500万米ドルに達した。新ラウンドは Icon Ventures がリードし、Glynn CapitalFour RiversK5 GlobalSequoiaGreylock が参加した。

特に2023年は Rockset は技術を成長させた。Rockset は、もともと Meta(旧Facebook)で作られたオープンソースの RocksDB の永続キーバリューストアを基盤としている。3月、Rockset はリアルタイムインデックスデータベースを劇的に高速化するためのプラットフォームアップデートを実施した。このアップデートに続いて4月には、AI のユースケースを可能にするベクトル埋め込みがサポートされた。

Rockset の共同創業者兼 CEO Venkat Venkataramani 氏は、VentureBeat に次のように語った。

基本的に我々が行っているのはリアルタイムのインデックス作成であり、アプリケーションにはベクトル埋め込みに対するリアルタイムのインデックス作成も必要であることがわかりました。

ベクトルのサポートは、単なる新しいデータ型にとどまらない

ある種のベクトルデータベースに保存されるベクトル埋め込みは、ジェネレーティブ AI の台頭とともに2023年に利用が拡大した。

データの数値表現であるベクトルは、大規模言語モデル(LLM)を支援するために使用される。ベクトル埋め込みをサポートする DataStaxMongoDBNeo4j などの既存のデータベース技術に加え、Pinecone や Milvus などの専用に構築されたベクトルデータベースが数多くある。

Rockset の内部では、ベクトル埋め込みは既存のデータベースで浮動小数点数の配列として知られているデータ型としてサポートされている。しかし Venkataramani 氏は単にデータ型としてベクトルをサポートすることは、彼にとって特に興味深いことではないと強調した。

むしろ、彼が興味深いと感じてるのは、Rockset がベクトル埋め込み用のリアルタイムインデックス技術を構築したことだ。このインデックスは、与えられたデータセットを検索するための論理的なキーを提供する。インデックスがリアルタイムで更新されることは、可能な限り最新の情報を必要とする特定のプロダクションユースケースにとって非常に重要である。

結局のところ、Rockset がメタデータのリアルタイムインデックスのために構築したのと同じ基本的なアプローチは、ベクトルにも有効だ。Venkataramani 氏によれば、通常のデータとベクトルの両方を照会できるリアルタイムインデックスを持つことは、最新のAIアプリケーションにとって有用だという。

我々が扱っているAIアプリケーションは、ベクターだけを扱うわけではありません。そのひとつひとつに関連する他のデータベースメタデータフィールドが常に存在し、アプリケーションはそれらすべてに対してクエリーを実行する必要があるのです。(Venkataramani 氏)

Rockset は、どのようにベクトル埋め込み用のリアルタイムインデックスを構築したか

Rockset のリアルタイムデータベースの基盤となっているのは RocksDB データストアで、同社はこれを「RocksDB Cloud」で拡張した。

Venkataramani 氏は、Rockset が RocksDB  Cloud で、あらゆるデータタイプのインデックス作成を高速化するための高度な技術を数多く開発してきたと説明した。同氏は、RocksDB Cloud は現在、ベクトルデータのリアルタイム検索を可能にするために重要な、近似最近傍(ANN)インデックスの実装を備えていると指摘した。

Rockset の他のインデックスと同じように、一度ベクトル埋め込み列の類似度ANNインデックスを作成すれば、それは常に最新の状態に保たれます。挿入、更新、削除にかかわらず、自動的に最新の状態に保たれます。(Venkataramani 氏)

Rockset はまた、高速データクエリのための分散 SQL エンジンを連携している。Venkataramani 氏は、同社の SQL エンジンはデータベース上でサポートされているすべてのデータタイプに対してリアルタイムでクエリーを実行できると指摘した。

1つの SQL クエリで、文字通り、フィルターや結合、集計を行うことができ、また、類似検索のユースケースで、ベクトル埋め込みを使用して関連性のランキングを行うこともできます。SQL エンジンは、レポートを待っているアナリストではなく、アプリケーションを動かすために作られているからです。(Venkataramani 氏)

Venkataramani 氏は、Rockset のAI 機能の開発がさらに進むと予想している。彼が楽しみにしている将来の機能の中には、LLM やジェネレーティブ AI のユースケースのクエリをさらに高速化するための GPU アクセラレーションのサポートがある。

この業界はまだ始まったばかりだ。このプラットフォームシフトは流行ではなく、あらゆるアプリケーションの中核となるものです。(Venkataramani 氏)

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する