<h1 id="%E3%81%AF%E3%81%98%E3%82%81%E3%81%AB">
<a class="header-anchor-link" href="#%E3%81%AF%E3%81%98%E3%82%81%E3%81%AB" aria-hidden="true"></a> はじめに</h1>
<p>DBが遅い原因の多くはインデックスの作り忘れです。<br>
サーバーの性能アップやパラメータ変更の効果も大きいですが、まず最初に検討するべきはインデックスでしょう。<br>
EXPLAINの結果をにらみながら、効果のありそうな場所を探します。</p>
<p>ただ、厄介なのはEXPLAINの結果が読みづらいことです。<br>
EXPLAINの読み方を説明している本やサイトはいくつもありますが、EXPLAINを使う機会が少ないため、読める人が限られた、職人芸に近い技術になっています。</p>
<p>なので、EXPLAINを読まなくてもインデックスを作れるツールをGoとSvelteで作りました。<br style="display:none">
<span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__61052857cd0b3" src="https://embed.zenn.studio/card#zenn-embedded__61052857cd0b3" data-content="https%3A%2F%2Fgithub.com%2Fmrasu%2FGravityR" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://github.com/mrasu/GravityR" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://github.com/mrasu/GravityR</a></p>
<p>GravityRを使うと、下のようにEXPLAINをタイムライン形式にした図やインデックスの効果を表示したHTMLが作成されます。</p>
<p><img src="https://storage.googleapis.com/zenn-user-upload/76c0217835eb-20221022.png" alt loading="lazy" class="md-img"></p>
<h1 id="%E7%B4%B9%E4%BB%8B">
<a class="header-anchor-link" href="#%E7%B4%B9%E4%BB%8B" aria-hidden="true"></a> 紹介</h1>
<p>GravityRはHasura、PostgreSQL、MySQLに対応しています。</p>
<p>実行ファイルをgithubに置いているので、<a href="https://github.com/mrasu/GravityR/releases" target="_blank" rel="nofollow noopener noreferrer">リリースページ</a>からダウンロードすればすぐに使えます。</p>
<p>Hasuraを使っているなら、コマンドラインでGraphQLを入力すれば、インデックスの効果を表示するHTMLが作成されます。<br>
その結果を使って、良さそうなインデックスを作ればいい、というわけです。</p>
<p>具体的には、</p>
<ol>
<li>HasuraのURLとシークレットを環境変数に設定する</li>
</ol>
<div class="code-block-container"><pre class="language-shell"><code class="language-shell"><span class="token comment"># 例:</span>
<span class="token builtin class-name">export</span> <span class="token assign-left variable">HASURA_URL</span><span class="token operator">=</span><span class="token string">"http://localhost:8081"</span>
<span class="token builtin class-name">export</span> <span class="token assign-left variable">HASURA_ADMIN_SECRET</span><span class="token operator">=</span><span class="token string">"myadminsecretkey"</span>
</code></pre></div><ol start="2">
<li>GravityRを実行する<br>
検証したいqueryとvariablesを入力する</li>
</ol>
<div class="code-block-container"><pre class="language-shell"><code class="language-shell"><span class="token comment"># 例:</span>
gr db suggest hasura postgres --with-examine <span class="token parameter variable">-o</span> <span class="token string">"output.html"</span> <span class="token parameter variable">-q</span> <span class="token string">"query MyQuery(\<span class="token variable">$email</span>: String) {
  tasks(where: {user: {email: {_eq: \<span class="token variable">$email</span>}}}) {
    user {
      name
    }
    description
  }
}
"</span> --json-variables <span class="token string">'{"email": "test1112@example.com"}'</span>
</code></pre></div><ol start="3">
<li>HTMLの内容から追加するインデックスを決める<br>
HTMLを開くと下のような表があるので、効果のあるインデックスがすぐわかります。<br>
この例では、tasksテーブルのuser_id列にインデックスを追加すればかなり速くなることがわかります。<br>
<img src="https://storage.googleapis.com/zenn-user-upload/14d9f3a2a1e5-20221022.png" alt loading="lazy" class="md-img">
</li>
<li>「Copy as Curl」の内容を実行してインデックスを追加する<br>
Hasuraの場合、表の右側にあるボタンをクリックするとインデックスを追加するためのqueryがコピーできるので、それを使うとインデックスが作れます。</li>
</ol>
<p>以上のステップをやれば終わりです。</p>
<p>PostgreSQLかMySQLを使う場合は、graphqlのクエリではなくSQLを使えば大丈夫です。<br>
例えばMySQLなら下のようにすると、htmlが作られます。後は同じです。</p>
<div class="code-block-container"><pre class="language-shell"><code class="language-shell"><span class="token builtin class-name">export</span> <span class="token assign-left variable">DB_ADDRESS</span><span class="token operator">=</span><span class="token number">127.0</span>.0.1 <span class="token assign-left variable">DB_USERNAME</span><span class="token operator">=</span>root <span class="token assign-left variable">DB_PASSWORD</span><span class="token operator">=</span>root <span class="token assign-left variable">DB_DATABASE</span><span class="token operator">=</span>gravityr
gr db suggest mysql --with-examine <span class="token parameter variable">-o</span> <span class="token string">"output.html"</span> <span class="token parameter variable">-q</span> <span class="token string">"SELECT name, t.description FROM users INNER JOIN tasks AS t ON users.id = t.user_id WHERE users.name = 'foo'"</span>
</code></pre></div><h1 id="%E5%86%85%E9%83%A8%E5%8B%95%E4%BD%9C">
<a class="header-anchor-link" href="#%E5%86%85%E9%83%A8%E5%8B%95%E4%BD%9C" aria-hidden="true"></a> 内部動作</h1>
<p>GravityRは、有効なインデックスを探すために実際にインデックスをDBに作っています。<br>
内部では次のステップがあります。</p>
<ol>
<li>EXPLAINの実行</li>
<li>SQLの理解とインデックス候補の列挙</li>
<li>インデックスの効果検証</li>
<li>HTMLの作成</li>
</ol>
<h3 id="1.-explain%E3%81%AE%E5%AE%9F%E8%A1%8C">
<a class="header-anchor-link" href="#1.-explain%E3%81%AE%E5%AE%9F%E8%A1%8C" aria-hidden="true"></a> 1. EXPLAINの実行</h3>
<p>EXPLAINを見なくてもいいとはいっても、やはりEXPLAINは見たくなるので表示しています。<br>
今の実装ではEXPLAINの結果を使って何か上手いことをやっているわけではないのですが、代わりにEXPLAINを見やすくしています。</p>
<p>EXPLAINをビジュアライゼーションする場合、大抵はツリー状に表示しますが、GravityRではトレーシングの結果のようにタイムラインで表示しています。<br>
実行の詳細を把握する時にはツリーで表示するのが正確ですが、遅い部分がぱっと見でわかるのはタイムラインかなと思って、タイムラインを使っています。</p>
<p><img src="https://storage.googleapis.com/zenn-user-upload/fe4e0e6ff9c4-20221022.png" alt loading="lazy" class="md-img"></p>
<h3 id="2.-sql%E3%81%AE%E7%90%86%E8%A7%A3%E3%81%A8%E3%82%A4%E3%83%B3%E3%83%87%E3%83%83%E3%82%AF%E3%82%B9%E5%80%99%E8%A3%9C%E3%81%AE%E5%88%97%E6%8C%99">
<a class="header-anchor-link" href="#2.-sql%E3%81%AE%E7%90%86%E8%A7%A3%E3%81%A8%E3%82%A4%E3%83%B3%E3%83%87%E3%83%83%E3%82%AF%E3%82%B9%E5%80%99%E8%A3%9C%E3%81%AE%E5%88%97%E6%8C%99" aria-hidden="true"></a> 2. SQLの理解とインデックス候補の列挙</h3>
<p>SQLをパースして、参照しているテーブルとカラムを把握します。<br>
良いパーサーを探していたところ、CockrockDBがPostgreSQL互換で、TiDBがMySQL互換だったので、彼らが作っているパーサーを使っています。<br>
それを使って、テーブル名の省略やサブクエリなどに対応しながら、粛々と名前解決しています。</p>
<p>こうして判明したテーブルとカラムの組み合わせから既存のインデックスの分を除くと、「ここにインデックスを貼れば効果があるのでは？」というインデックスが導けます。</p>
<h3 id="3.-%E3%82%A4%E3%83%B3%E3%83%87%E3%83%83%E3%82%AF%E3%82%B9%E3%81%AE%E5%8A%B9%E6%9E%9C%E6%A4%9C%E8%A8%BC">
<a class="header-anchor-link" href="#3.-%E3%82%A4%E3%83%B3%E3%83%87%E3%83%83%E3%82%AF%E3%82%B9%E3%81%AE%E5%8A%B9%E6%9E%9C%E6%A4%9C%E8%A8%BC" aria-hidden="true"></a> 3. インデックスの効果検証</h3>
<p>インデックス候補が出たら、実際にインデックスを追加してクエリの速度を比較します。<br>
ひとつ作っては計測して消し、別のインデックスを作る・・の繰り返しです。</p>
<h3 id="4.-html%E3%81%AE%E4%BD%9C%E6%88%90">
<a class="header-anchor-link" href="#4.-html%E3%81%AE%E4%BD%9C%E6%88%90" aria-hidden="true"></a> 4. HTMLの作成</h3>
<p>ここまでの作業結果をまとめてHTMLを作ります。<br>
HTMLを作るときにはSvelteとTypescriptを使っていて、javascriptとcssを作った後にGoの中で一つのHTMLにまとめています。<br>
Hasura、PostgreSQL、MySQLのどれでも、ほとんど同じ内容を出しますが、EXPLAINの形式など微妙に違う場所があるので、その部分は各部分にあわせてsvelteの中で分岐しています。</p>
<h1 id="%E4%BD%BF%E3%81%A3%E3%81%A6%E3%81%8F%E3%81%A0%E3%81%95%E3%81%84%EF%BC%81">
<a class="header-anchor-link" href="#%E4%BD%BF%E3%81%A3%E3%81%A6%E3%81%8F%E3%81%A0%E3%81%95%E3%81%84%EF%BC%81" aria-hidden="true"></a> 使ってください！</h1>
<p>ということで、速度改善のためにGravityRを作ったという話でした。<br>
この記事ではインデックスを自動的に作る方法について書きましたが、AWSのPerformanceInsightsから遅いクエリを見つけたり、EXPLAINだけをする機能もあります。</p>
<p>これからは、APMのデータやメトリクスを使ったり、過去と比較したりしてSQLだけでなくアプリケーションの色々なボトルネックを見つけられればな、と思っています。<br style="display:none">
<span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__ead675eeb24ab" src="https://embed.zenn.studio/card#zenn-embedded__ead675eeb24ab" data-content="https%3A%2F%2Fgithub.com%2Fmrasu%2FGravityR" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://github.com/mrasu/GravityR" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://github.com/mrasu/GravityR</a></p>


Hasura, PostgreSQL, MySQL対応の速度改善ツールを作りました - GravityR

2. SQLの理解とインデックス候補の列挙

Discussion