独占:Foundational がデータ品質と AI 対応の課題に取り組むために 800 万ドルをかけてステルスから浮上

SHARE:

Foundational は、現代のデータインフラにおける混沌に秩序をもたらすことを目指すスタートアップである。同社は本日(3月25日)、 Viola VenturesGradient Ventures (Google の AI に特化した投資ファンド) が主導する800万ドルのシード資金調達を発表した。他にもエンジェル投資家やベンチャー企業が参加している。同社のプラットフォームは、データチームのコードを自動的にマッピングし分析することで、潜在的な問題を特定し、修正を提案し、AI アプリケーション用のデータ準備を支援する。

Foundational は過去1年半ほどステルスモードで活動してきたが、今回その技術を一般に公開することになった。RampLemonade などの上場企業が既に顧客として契約している。Foundational CEO 兼共同設立者の Alon Nafta(アロン・ナフタ)氏は、VentureBeat の独占インタビューで、同社の物語をより広く共有する適切な時期だと判断したと語った。

「この1年、1年半ほどで、データチームが書いているコードを自動的にマッピングして理解する能力を本当に構築してきました。そしてそれを、新しい AI の世界や宇宙とつなぐこともできるようになりました。そして今、AI ツールを使ってどのようにそれを活用できるか、そして AI が消費するためのデータをどのように準備できるかを本当に理解できるようになったのです」(Nafta 氏)。

データ品質の危機への取り組み

以前サイバーセキュリティとデータインフラの分野で働いていた Nafta 氏は、多くの組織がデータ機能を拡大する際に直面する成長痛に対処するために Foundational を共同で設立した。Snowflake、Databricks、dbt などのツールによってデータがこれまで以上にアクセスしやすくなった一方、複雑な広範囲にわたるデータパイプラインが生まれ、維持が困難になっているのだ。

「一般的な組織におけるデータについて考えてみると、データは多くの手を経て動き回っています。どこかからデータを取り込むエンジニアがいて、それを整理するデータエンジニアがいます。そして、分析を行ったり、モデリングを行ったりするアナリストやアナリティクスエンジニアがいるわけです。たくさんのやり取りがあるのです」(Nafta 氏)。

その結果、Nafta 氏によると、データチームはしばしば「それらの依存関係がどのように相互に機能しているかを見失ってしまう」のだそうだ。それが原因で、変更が加えられた際に混乱や品質の問題、ダッシュボードの破損につながるのだという。Gartner 社の調査によると、データ品質の悪さが組織に与える平均的な財務的影響は年間1,280万ドルだという。この調査で取り上げられた40社全体では、低品質データによるコストの合計は年間5億1,000万ドル以上にもなる。

コード分析によるデータガバナンスの自動化

Foundational は、データチームのソースコードを自動的に分析することで、データの系譜をマッピングし、デプロイ前に潜在的な問題を特定することでこの問題を解決しようとしている。このプラットフォームは、GitHub などのツールと統合され、開発者の既存のワークフロー内で実行可能な提案や修正を直接提供する。

「開発者らは、私たちのインサイトや警告、提案を、彼らが既に持っているインターフェイス内で直接見ることができます」と Nafta 氏は述べた。重要なのは、Foundational がアクセスを必要とするのはコードに表現されたメタデータのみで、基礎となるデータ自体へのアクセスは必要としないことだ。これによりデータのプライバシーとセキュリティの懸念が軽減される。

内部的には、Foundational プラットフォームは静的コード分析、動的ランタイム分析、AI を活用した技術を組み合わせて、組織のデータパイプラインの包括的なマップを構築する。循環参照、クラウドコストを急増させる可能性のある非効率的なクエリ、使用されなくなったフィールドの剪定など、様々な問題を特定できるのだ。

「データエコシステムの完全なマップができあがれば、その上に様々な強力な自動化を適用できます。変更によって下流の依存関係が壊れそうだと警告したり、パフォーマンスを最適化してコストを削減する方法を提案したりできます。コードに基づいてドキュメントやデータカタログを自動生成することさえできるのです」(Nafta 氏)。

AI 主導の未来のためのデータ準備

企業がよりデータ主導型になり、AI を採用しようとする中で、データの品質と一貫性を維持するためのツールが重要な必要性になってきていると業界アナリストは述べている。Gartner 社の最近のレポートによると、2024年までに、 組織の50%が最新のデータ品質ソリューションを採用し 、デジタルビジネスイニシアチブをよりよくサポートするようになるという。

しかし、データ品質は物語の一部に過ぎない。企業が機械学習モデルをビジネス全体に導入しようと急ぐ中、データがその作業に適していないことが多いことに気づいているのだ。データサイエンティストの作業時間の最大80%が、モデル構築を始める前のデータのクリーニング、ラベリング、構造化などの「データ掃除作業」に費やされることがある。

Foundational は、コード分析アプローチを通じてこのプロセスの合理化を支援する機会があると考えている。組織のデータ資産の完全なコンテキストと系譜を理解することで、このプラットフォームは多くのデータ準備作業を自動化し、最適なモデルパフォーマンスのためにデータを構造化する方法を推奨できる可能性がある。

「データの要素は、AI 施策などの改善にどのように使うか、そして AI を使ってデータをどのように改善できるかという、常に2つの場所で関連性があります。それはサイクルのようなものです。ここにはたくさんの技術とクールなものがあります」(Nafta 氏)。

規模の拡大と将来の展望

800万ドルの新たな資金調達により、Foundational はエンジニアリング・チームを拡大し、市場開拓を強化する計画だ。同社は現在、主にサンフランシスコとイスラエルを拠点に16名の従業員を擁している。より多くの企業が AI と機械学習の実装を模索する中、Nafta 氏は Foundational のプラットフォームが企業のデータ体制を整える上で重要な役割を果たすと考えている。

今回のシードラウンドは、運用資産30億ドル以上のイスラエルのベンチャー企業 Viola Ventures と、AI イノベーションの次の波を育成することに特化した Google の新しい投資ファンド Gradient Ventures が主導した。他の参加投資家には、 Asymmetric Venture Partners、Datadog、Intuit、Meta、Wiz などの幹部らが名を連ねている。

データ量が指数関数的に増加し続け、AI がビジネスの主流の能力となりつつある中で、Nafta 氏は、データパイプラインを自動的に理解し、品質を強化する能力が必須のものになると考えている。包括的なコード分析アプローチを採用する Foundational は、データ主導のイノベーションの新時代を支える基盤となることを目指している。

「私たちは、あらゆる組織に高品質で信頼できるデータを提供し、その上に構築できるようにすることをミッションとしています。私たちにとって、これはほんの始まりに過ぎません」(Nafta 氏)。

【via VentureBeat】 @VentureBeat

【原文】

Members

BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。
無料で登録する