🦦

MLでDBをイイ感じにしてくれるOtterTuneを使ってみた

2022/08/31に公開

追記2024/7/17

どうやらOtterTuneの開発元企業が廃業していたみたいです。

https://ottertune.com/

https://x.com/andy_pavlo/status/1801687420330770841

共同ファウンダーの投稿を見ると6月ごろに突然廃業されたみたいです。詳細は不明ですが企業買収に騙されたと書いてあり、不穏な気配があります。

DBパフォーマンスチューニングという珍しいSaaSだっただけに残念です。

概要

先日ラクスさんが主催されるLTイベントに参加しました。
https://rakus.connpass.com/event/253656/

登壇者のHank Ehlyさんが発表したサービスが面白そうでしたので登録してみた感想を述べていきます。

https://speakerdeck.com/hankehly/ottertune-mldedbwozui-shi-hua-suruturufalseshao-jie

DBのパフォーマンスチューニングは難しい

皆さんはDBは何を使われていますか?企業さん含めて今は自前でDBを持つよりもAWS RDSに代表されるマネージドなデータベースを利用されているかと思います。
DBのバージョンアップやバックアップの取得を自動で実行してくれて、パラメーターの設定もコンソールから簡単にできるのが魅力的です。

RDSのパラメータ設定画面
ですが、そもそもDBのパラメーターチューニング作業が中々ハードルが高くデフォルト設定からの変更となりますとDBの専門的な知識が必要になり、またその設定変更がうまくいくかどうかは設定後の結果反映次第なため、本番環境になにかしらの影響を与えてしまうという問題点があります。

DBパフォーマンスチューニングの難しさ

  • DBの専門的知識
  • 設定変更後の本番影響の予測

結果として下手に設定値をいじるよりかはよりスペックの高いDBにアップグレードするというマネーで殴る💸対応にしがちです。

その問題点を解決するのが今回紹介するOtterTuneになります。

OtterTune

https://ottertune.com/

OtterTuneは機械学習を利用して、DBの利用状況を分析し最適なパラメーターを提案し、改善してくれるSaaSプロダクトです。
2022年8月時点で対応しているDBはAWSのRDSしかないためまだ限定的なサービスです。

Database System Provider Versions
PostgreSQL Amazon RDS v10, v11, v12, v13, v14
PostgreSQL Amazon Aurora v10, v11, v12, v13
MySQL Amazon RDS v5.6, v5.7, v8.0
MySQL Amazon Aurora v5.6, v5.7

https://docs.ottertune.com/

使ってみる

OtterTuneはエージェントをRDSに導入し、メトリクスを取得することでパラメーターを機械学習して最適化します。
サインアップ後に最初にやることはAWSのIAMロールを作成し、自身のAWSアカウントとOtterTuneを連携するところから始めます。

IAMロール作成の案内

CloudFormationから作る方法とTerraformから作る方法が公式から提供されていますので好みのツールでIAMロールを作成します。

CloudFormation作成画面

IMAロール作成後セットアップ画面にIAMロールのARNを入力すればOtterTuneと自身のAWSアカウントの連携が始まり、ダッシュボードに稼働しているAWS RDSの一覧が表示されます。

ottertune ダッシュボード

RDS一覧からottertuneと連携したいDBを有効化し、エージェントをDBにデプロイします。
DBへのデプロイ方法ですが、いくつか方法が紹介されていてもっとも簡単なのがCloudFormation経由でのFargateによるデプロイです。
https://docs.ottertune.com/info/connect-your-database-to-ottertune/add-database/agent
セットアップ画面にAPIキーが出力されていますのでコピーしてCloudFormationのスタックに張り付けて実行すればエージェントがDBにデプロイされます。

エージェントデプロイ後はDBのメトリクス情報を収集できるようにするために読み取り用のDBユーザーを作成する必要があります。

CREATE USER 'ottertune' IDENTIFIED by 'user-password';
GRANT PROCESS ON *.* TO 'ottertune';
GRANT REPLICATION CLIENT ON *.* TO 'ottertune';
GRANT SHOW VIEW ON *.* TO 'ottertune';
GRANT SELECT ON mysql.innodb_index_stats TO 'ottertune';
GRANT SELECT ON performance_schema.table_io_waits_summary_by_index_usage TO 'ottertune';
GRANT SELECT ON performance_schema.events_statements_summary_by_digest TO 'ottertune';
-- if mysql version >= 8.0
GRANT SELECT ON performance_schema.events_statements_histogram_global TO 'ottertune';

読み取り用のDBユーザーを作成すればエージェントとの接続が有効化されます。

ダッシュボードの見た目はこんな感じです。

Overview

Performance Charts

Activeになっている部分がMLで学習した最適値をOtterTuneで自動的に設定された記録になります。

チューニングオプションで自動反映の可否や再起動無効化の設定、チューニングのインターバルを決めれます。
https://speakerdeck.com/hankehly/ottertune-mldedbwozui-shi-hua-suruturufalseshao-jie?slide=7

ヘルスダッシュボード


Database HealthやTable HealthはAWS側でPerformance Insightsを有効化、DBパラメーターで特定の値を入れることでダッシュボードが表示されます。


Performance Insightsを有効化

名前
innodb_monitor_enable module_trx

Configurations


OtterTuneがDBのパラメーターを変更できるようにするために冒頭で作成したIAMロールOtterTuneRoleにDBパラメーターグループ(DBクラスターパラメーターグループ)の修正許可ポリシーをアタッチさせます。

OtterTuneDBPolicy
{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Sid": "VisualEditor0",
            "Effect": "Allow",
            "Action": [
                "rds:List*",
                "cloudwatch:List*",
                "cloudwatch:Describe*",
                "ce:Describe*",
                "rds:ModifyDBParameterGroup", #手動追加
                "iam:SimulatePrincipalPolicy",
                "rds:Describe*",
                "ce:List*",
                "budgets:Describe*",
                "pi:DescribeDimensionKeys",
                "ce:Get*",
                "rds:ModifyDBClusterParameterGroup", #手動追加
                "cloudwatch:Get*",
                "pi:GetResourceMetrics"
            ],
            "Resource": "*"
        }
    ]
}

OtterTuneはSlack連携もできまして、パラメーターチューニングが完了したらSlackに通知もしてくれるAppも提供されています。

Setting画面からSlack連携


Apply完了を通知
あくまでも通知機能しかないので、Slackから操作はできなさそうです。
https://docs.ottertune.com/info/slack-integration

Notifications sent by the app
Tuning Disabled
Configuration Applied
Configuration Ready (Manual Review turned on)

備考

FAQを眺めていますといくとか気になった点がありましたので訳して紹介します。
https://docs.ottertune.com/info/frequently-asked-questions

Q.OtterTuneはクエリやインデックスのチューニングはしてくれますか?

現在、OtterTuneはデータベース構成設定の解析と調整のみを行ないます。クエリ、インデックス、データベース設計の解析や変更を推奨するものではありません。

Q.エージェントデプロイ時にCloudFormationの入力値に使うSecurityGroupやSubnetは何ですか?

エージェントをデプロイするときに使うSecurityGroupとSubnetの要件は以下2つです。

  1. デプロイするECS FargateからRDSに接続できるアクセス権があること。
  2. 0.0.0.0/0のアウトバウンドhttpsアクセス権があること

Hank Ehlyさんのスライドから抜粋

Q.パフォーマンス向上はどれくらいか?

デフォルトの設定から5%-15%ほど向上できるとのこと
https://speakerdeck.com/hankehly/ottertune-mldedbwozui-shi-hua-suruturufalseshao-jie?slide=12

Q.何台までのDBをサポートしてくれる?

詳細不明。公式ページにはEnterprise priceがあるみたいです。(LTのときは6台以上から別途相談になるかもと話されていました)
https://ottertune.com/pricing/

所感

OtterTuneについて紹介しました。
LTではじめて存在を知ったサービスで導入も難しくなかったので、こんなサービスがあるということを知れて良かったです。
1台までなら無料で利用できるので、会社で使えないか提案してみようかなと思います。

参考文献

https://docs.ottertune.com/
https://youtu.be/SJdnpAMI_q4

GitHubで編集を提案

Discussion