OpenAIがRocksetを買収:データベースとAI業界への影響
6月21日、OpenAIはRocksetを買収したと発表しました。このニュースは、データベース業界やより広範なデータ・AI分野で大きな注目を集めています。このニュースを聞いて、多くの人が以下の3つの重要な疑問を抱くでしょう:
- なぜOpenAIはRocksetを買収したのか?
- この買収はデータベース業界にとってプラスかマイナスか?
- Rocksetの既存顧客はどうすればよいのか?
過去2週間、私はRocksetの同僚、ベンチャーキャピタリスト、および他のデータベース業界の専門家とこの買収について議論しました。ここでは、この重要な展開に関する私の見解を共有します。
Rocksetとは?
Rocksetは、Facebookのオープンソースプロジェクト(RocksDBやTAOなど)の主要メンバーによって設立されたデータベース企業です。2017~2018年、Rocksetのチームが立ち上がったばかりの頃、私は彼らと広範に議論しました。その当時、Rocksetは革新的な取り組みを行っていました。クラウド、リアルタイム処理、半構造化データに焦点を当てており、その中核技術はRocksDBをベースとした収束インデックスと呼ばれるインデックス方法です。簡単に言うと、JSONファイルをRocksetにインポートすると、ファイル内のすべてのフィールドに対してさまざまなインデックスを作成し、ポイントアクセス、検索、分析などの多様な操作を可能にします。
このインデックス方法の利点は、その汎用性により幅広いユースケースをサポートできる点です。しかし、欠点として、これらのインデックスを作成および保存する際のCPUやストレージコストが高くなる可能性があります。Rocksetのビジネスにとって、この汎用性はより広い市場への到達を意味しますが、一方でさまざまなシナリオに対応するための大規模なエンジニアリング努力も必要です。明らかに、8年にわたる努力の末、Rocksetは非常に成功した製品を開発し、数百社の顧客を獲得しました。
なぜOpenAIはRocksetを買収したのか?
世界をリードするAI企業であるOpenAIの買収は、自然と市場の注目を集めます。今回のRockset買収についても、多くの関心が寄せられています。クラウドデータベースがAI時代のAI企業にどのような価値を提供できるのか、疑問に思う人も多いでしょう。私は、RocksetはOpenAIに少なくとも2つの価値を提供すると考えます。
最初の価値は、検索強化生成(Retrieval-Augmented Generation, RAG)の強化です。公式発表でも言及されているように、OpenAIは「検索インフラを強化する」ためにRocksetを買収しました。検索インフラはRAGの構築において重要なコンポーネントです。Rocksetはすでにベクター検索を含むさまざまな検索機能をサポートしており、OpenAIのニーズに適合しています。市場には多くの専門的なベクターデータベースが登場していますが、OpenAIが必要とするデータ量を扱える製品は限られています。Rocksetのクラウドネイティブなアーキテクチャは、おそらく適切なソリューションの1つです。
2つ目の価値は、データ処理と分析にあります。AI企業であれそうでなかろうと、データ処理と分析サービスは不可欠です。請求情報をユーザーに表示することから、社内レポートの生成まで、OpenAIはRocksetのサービスを活用できます。データがなければAIも存在しません。明らかに、RocksetはOpenAI内でさまざまなサービスを構築するために利用されるでしょう。
では、なぜOpenAIはRocksetを買収し、クラウド製品の購入では済ませなかったのでしょうか?OpenAIはおそらくRocksetや類似製品を直接購入することも検討したでしょう。しかし、OpenAIのトラフィックは膨大であり、2023年にはそのウェブサイトのトラフィックが多くのトップグローバル検索エンジンを上回りました。そのような高トラフィックに耐えられるデータベース製品は少なく、仮に存在しても、OpenAIは最大の顧客となり、年間数十億ドルのソフトウェアサービス料金を支払う必要があるでしょう。ゼロから製品を構築するには数年かかり、システムの保守と最適化にも多大な努力が必要です。数十億ドルの年間費用を支払うか、数年かけて新しいシステムを開発するかという選択肢の中で、企業を買収してカスタムサービスを構築する方がOpenAIにとって賢明な選択となります。
この買収はデータベース業界にとってプラスかマイナスか?
私は、Rocksetの買収はデータベース業界にとって非常にポジティブな出来事だと考えています。まず、次の2つの事実を認識する必要があります。1つ目、世界経済は依然として低迷しており、一部のヨーロッパ諸国では景気後退に陥っています。2つ目、資金の多くはAI分野に流れており、データベースのような「伝統的な」分野は注目を集めにくい状況です。
このような外部環境の中で、OpenAIによるRocksetの買収は間違いなく憶測を呼ぶでしょう。
業界関係者との議論やRocksetの製品分析に基づくと、この買収は業界にとって非常にポジティブな影響を与えると考えられます。以下は、公的データに基づく分析です。
まず、Rocksetは昨年8月に4400万ドルのシリーズB資金調達を完了しました。このことから、買収時点でRocksetはかなりの現金を保有していたと考えられ、選択肢が多かったと推測されます。この場合、買収を受け入れる決定はRockset側にあったと言えます。
次に、8年以上かけて開発されたシステムであり、Rocksetは成熟した製品を持ち、100社以上のエンタープライズ顧客を抱えています。これは、製品が一定のプロダクトマーケットフィット(PMF)を達成していることを示しています。さらなる資金提供があれば、Rocksetは開発を加速させることができるでしょう。
最後に、OpenAIのような顧客にサービスを提供することは、Rocksetにとって大きな利益を生むと予測されます。この状況を考えると、買収を選択した背景には、OpenAIから非常に好条件の提示があったと推測されます。
Rocksetの既存顧客はどうすればよいのか?
OpenAIによる買収後、Rocksetは3か月以内にクラウドサービスを停止する予定です。これは厳しいように聞こえますが、理解できる決定です。OpenAIはデータベース市場に参入するつもりはないでしょう。買収した会社がそのまま事業を続けるよりも、自社のニーズに専念させた方が良いのです。
Rocksetのユーザーにとって、システム移行の手間が発生します。どのシステムを選べば良いのでしょうか?買収のニュースを受けて、多くのデータベース企業がSNSでRocksetの代替を提供できると宣伝しています。しかし、私はRocksetの機能は独自かつ包括的であるため、1つのデータベースですべてを完全に代替するのは難しいと考えます。そのため、代替システムを選ぶ際には、ユーザーの具体的なユースケースに焦点を当てるべきです。
Rocksetの製品を分析すると、機能は次のカテゴリに分類できます:ストリーミング、テキスト検索、分析、ベクター検索。
多くのベンダーがさまざまな機能を提供していると主張していますが、各社にはそれぞれ得意分野があります。以下に、これら4つのカテゴリに基づいて、優れたベンダーをリストアップしました。
ベンダー | ユースケース | |
---|---|---|
ストリーミング | RisingWave、Materialize | データソースから連続データの取り込みや事前定義されたクエリの計算が必要な場合 |
テキスト検索 | Elastic、AWS OpenSearch | 多数のファイル内のテキストを正確または曖昧に一致させたい場合 |
分析 | ClickHouse、Imply、Druid、StarRocks | 大量の履歴データを頻繁にスキャンして統計を取る必要がある場合 |
ベクター検索 | Pinecone、Chroma、Milvus、Weaviate、Qdrant | 類似したベクターを頻繁に検索する必要がある場合 |
もちろん、多くの場合、これらのシステムはすべてユーザーの要件を満たすことができます。その場合、システムの迅速なサポート対応やベンダーが顧客のフィードバックを聞く姿勢が重要な差別化要因となります。
まとめ
OpenAIは内部の検索および分析プラットフォームを構築するためにRocksetを買収しました。この買収はデータベース分野にとって大きなプラスです。Rocksetのユーザーでサービス移行が必要な場合、具体的なユースケースに基づいて最適な製品を選択することをお勧めします。異なるシステムがすべてビジネスニーズを満たす場合、顧客サービスが最も優れたものを選びましょう。
Discussion