🗽

【re:Invent 2022】Amazon DocumentDBの新機能-Session Report

2022/12/02に公開

AWS re:Invent 2022で行われた、「What’s new with Amazon DocumentDB」のセッションレポートです。

この記事は、要点・見どころ・ポイントについてまとめます。

セッション概要

Title

What’s new with Amazon DocumentDB

Amazon DocumentDBの新機能

タイトルが直前になって変更されました↓

Scaling with Amazon DocumentDB Elastic Clusters

Amazon DocumentDB Elastic Clustersによるスケーリング

Overview

Amazon DocumentDB (with MongoDB compatibility) is a fully managed native JSON database designed for scaling enterprise workloads. Amazon DocumentDB provides you the flexibility of a document database without the time-consuming database administration tasks, freeing you to focus on innovation. In this session, learn about the newly launched feature, Amazon DocumentDB Elastic Clusters. Amazon DocumentDB Elastic Clusters scale within minutes to handle millions of reads and writes with petabytes of storage capacity, helping you cost-effectively meet the needs of your most demanding document workloads. Learn how you can use Amazon DocumentDB Elastic Clusters to meet your throughput and storage needs without managing instances or underlying infrastructure.
Amazon DocumentDB (とMongoDBの互換性)は、エンタープライズワークロードをスケーリングするために設計された、完全に管理されたネイティブJSONデータベースです。Amazon DocumentDBは、時間のかかるデータベース管理タスクなしでドキュメントデータベースの柔軟性を提供し、イノベーションに集中することができます。このセッションでは、新しくリリースされた機能であるAmazon DocumentDB Elastic Clustersについて学びます。Amazon DocumentDB Elastic Clustersは数分以内にスケールアップして、数百万の読み取りと書き込みをペタバイトのストレージ容量で処理し、最も要求の厳しいドキュメントワークロードのニーズにコスト効率よく対応できるようにします。Amazon DocumentDB Elastic Clustersを使用して、インスタンスや基盤となるインフラストラクチャを管理することなく、スループットとストレージのニーズを満たす方法を学びます。

Services

Amazon DocumentDB

Session type

Breakout Session

Speakers

  • Rashim Gupta, Senior Manager, Product Management, Amazon Web Services
  • Vin Yu, Super Product Manager, Amazon

Youtube

セッション動画が公開されてます

https://www.youtube.com/watch?v=Eg0tJEAZVhU

Report

DocumentDBから新機能「Elastic Clusters」が登場

Amazon DocumentDB Elastic ClustersがGAされました!

Elastic Clustersの良いところ

  • 基盤となるインフラストラクチャを自動的に管理する
    • インスタンスの作成、削除、アップグレード、またはスケールの管理が不要に
  • 毎秒数百万の読み取り/書き込みとペタバイトのストレージ容量でワークロードをサポート

https://aws.amazon.com/jp/blogs/aws/announcing-amazon-documentdb-elastic-clusters/

Amazon DocumentDB Elastic Clustersは、ユーザーがMongoDBシャーディングAPIを活用してクラスターを拡大できるようにする新しいタイプのAmazon DocumentDBクラスターです。 Elastic Clustersは、データを配布し、複数の基礎となる計算インスタンスとボリューム間で計算することにより、実質的に任意の数の読み取りと書き込みをペタバイトのストレージ容量で処理します。

Agenda

Amazon DcoumentDBとは?

  • JSONオブジェクト構造で持つデータベースサービス
    • JSONデータの保存、クエリ、インデックス作成が簡単
  • MongoDB互換データベース
    • 俊敏でスケーラブル
  • フルマネージドサポート
    • 高可用性
    • パッチ自動化
    • モニタリング
  • MongoDB APIの互換性

なぜdocument databaseを使う必要があるのか?

利点

  • JSON data
  • 柔軟なスキーマ
  • アドホッククエリ
  • フレキシブル

DocumentDBは非常に多くのカスタマーが利用している。
DocumentDBは2019年からスタートし、他AWSサービスに比べて新しいサービスである。

追加された機能

  • 新リージョン
    • イタリア、中国
  • インスタンスの高可用性
    • Graviton2 instanse availvability
  • クエリ機能
    • Geospatial indexes
    • Aggregati onoperators
    • Dcimal128
  • Enterprise management features
    • Dynamiic voulme resizeing
    • Dast database cloning
    • Query auditing (now with DML)
    • Performance Insights(preview)

Elastic Clustersの紹介

例えば、JSONファイルをキャビネットに格納するイメージで、多くなればなるほどキャビネットの段数も増える。
Elastic Clustersはこういったケースも柔軟に対応し、スケールアップまたはアウトし、スケールインまたはダウンも可能となる。

  • ワークロードのスループットを秒間数百万単位の読み取り/書き込みをサポートしている。

  • 3つの可用性ゾーン(AZ)で高可用性となっている。

  • Elastic Clustersは1つ以上のシャードで構成されている。

  • Elastic Clustersとは?

    • 俊敏でスケーラブル
    • フルマネージド
    • MongoDB APIの互換性
      • 100件以上のAPI操作をサポート

How it works

DocumentDB cloud-native architecture

  • 重要なポイントはコンピューティングとストレージの分離であり、これはスケーリングできるため
  • データ移動は関係なく、分散ストレージボリューム
    • インスタンス(レプリカ)を追加できる
    • 移動は同じ分散ボリュームとなる
    • 通常は6つのコピーを作成するが、支払うのは1つだけ
    • 非常に耐久性の高いサービスを提供

Elastic cluster arhitecture

  • クラスターがそれぞれシャードとなる
  • 重要ポイントはそれぞれ独自の計算能力を持っていること
  • それぞれ独自のWrite機能があり、ストレージパーティションがある
    • これがペタバイトストレージを実現し秒間数百万の書き込みを実現している

What makes a good shared key

優れたシャードキーに2つの重要なポイントがある

1.Evenly distributes storage

  • データを配布するにはシャードキーが必要
  • シャードキーがストレージを均等に分散するため、データが得られる
  • 例えば10のシャードと10テラバイトのデータがあった場合、シャード全体に均等に分散できる

2.Evenly distributes load

  • シャードの1つに多くのクエリを投げるのはよくない
    • Challenge 1: Uneven data distribution
      • データが不均等であっても時間が経つにつれて、書くシャードキーは64テラバイトのデータを単独で処理できる
    • Challenge 2: Uneven load distribution
      • データの負荷不均等に分散される可能性がある
      • そのため1つは高濃度(一意な値の数が多いもの)を選択
      • 2つはシャードの頻度と使用パターンを選択

How is it priced

短いシャードキーを選択する必要があるが、前払いのコストで使用した分だけ支払うことができる

  • Compute: vCPUs per hour
  • Storage: GB per month
  • Backup: GB per mounth

締め

今ならフリートライアルも可能なので、DocumentDBを使って試してみましょう

まとめ

事前に登録されてた情報が「What’s new with Amazon DocumentDB」のタイトルでありましたが、Keynoteで「Elastic Clusters」が発表されたためかセッションのタイトルが急遽変更されてて戸惑いました。。。
セッションは1時間のところ30分で終わりましたが、実際にデモを拝見し興味深いセッションとなりました。
ブレイクアウトセッションで実際にデモを行っていてわかりやすかったのも印象に残りました。

以上

Discussion