<h2 id="%E3%81%AF%E3%81%98%E3%82%81%E3%81%AB">
<a class="header-anchor-link" href="#%E3%81%AF%E3%81%98%E3%82%81%E3%81%AB" aria-hidden="true"></a> はじめに</h2>
<p>この記事はYAMAPアドベントカレンダー8日目の記事です。</p>
<p><span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__01ac2ff58ede3" src="https://embed.zenn.studio/card#zenn-embedded__01ac2ff58ede3" data-content="https%3A%2F%2Fqiita.com%2Fadvent-calendar%2F2023%2Fyamap-engineers" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://qiita.com/advent-calendar/2023/yamap-engineers" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://qiita.com/advent-calendar/2023/yamap-engineers</a></p>
<p>こんにちは。YAMAP STOREというECサイトのフロントエンドエンジニアをやっているKentaroです。YAMAP STOREではエラー監視ツールに <a href="https://sentry.io/welcome/" target="_blank" rel="nofollow noopener noreferrer">Sentry</a> を用いています。今回YAMAP STOREでのSentryの運用について改善したことを紹介します。</p>
<h3 id="%E8%AA%B2%E9%A1%8C">
<a class="header-anchor-link" href="#%E8%AA%B2%E9%A1%8C" aria-hidden="true"></a> 課題</h3>
<p>エラー監視にSentryを導入しているものの、いくつか課題がありました。</p>
<ul>
<li>エラー通知が多く、重大なエラーかどうかわかりづらい（オオカミ少年状態 🐺）</li>
<li>エラー内容からの調査が難しい</li>
</ul>
<p>重大なバグにすぐに気付け、エラー内容からの調査しやすいことが理想の状態です。このギャップを埋めるため、いくつか施策に取り組みました。</p>
<h2 id="%E9%87%8D%E5%A4%A7%E3%81%AA%E3%83%90%E3%82%B0%E3%81%AB%E6%B0%97%E4%BB%98%E3%81%91%E3%82%8B%E3%82%88%E3%81%86%E3%81%AB%E3%81%99%E3%82%8B">
<a class="header-anchor-link" href="#%E9%87%8D%E5%A4%A7%E3%81%AA%E3%83%90%E3%82%B0%E3%81%AB%E6%B0%97%E4%BB%98%E3%81%91%E3%82%8B%E3%82%88%E3%81%86%E3%81%AB%E3%81%99%E3%82%8B" aria-hidden="true"></a> 重大なバグに気付けるようにする</h2>
<p>重大なバグに気付くには、未解決のエラーをできるだけ少なくしノイズを小さくすることが大事かと考えています。<br>
以下の3点を取り組みました。</p>
<h3 id="%E3%83%88%E3%83%AA%E3%82%A2%E3%83%BC%E3%82%B8">
<a class="header-anchor-link" href="#%E3%83%88%E3%83%AA%E3%82%A2%E3%83%BC%E3%82%B8" aria-hidden="true"></a> トリアージ</h3>
<p>ノイズの改善にはトリアージ作業が重要になります。確立していなかったトリアージのワークフローを整備しました。<br>
ステータスが <code>Unresolved: ONGOING</code> を0にすることは難しいですが、<code>Unresolved: NEW</code> のものを可能な限り0に保てる運用を考えました。<br>
以前は <code>for-review</code> や <code>unresolved</code>、<code>ignore</code> といったステータス名でしたが、数ヶ月前に名前と仕組みが変更されました。<br>
公式の<a href="https://docs.sentry.io/product/issues/states-triage/" target="_blank" rel="nofollow noopener noreferrer">Issue Status</a></p>
<p>トリアージの内容は以下になります。</p>
<ul>
<li>対応する
<ul>
<li>Ongoing</li>
<li>issue化し、担当者をアサイン</li>
</ul>
</li>
<li>先送り
<ul>
<li>制限付きArchived</li>
</ul>
</li>
<li>対応しない
<ul>
<li>Archived</li>
</ul>
</li>
</ul>
<p>制限付きArchivedは一定期間や一定回数到達といった条件が満たされるまでエラーを除外できます。重大な影響は与えていない、かつ、すぐには判断が難しいものにはこの先送りを適用します。また、SentryのEscalating機能により、短期間でエラーイベントが大幅に増加した場合には自動的にUnresolved: Escalatingに変更されます。</p>
<p>上記のトリアージを平日1回、担当者が行い、悩むものはチームで決めるという方針で進めています。<br>
この運用により、ノイズとなるエラーを大幅に減らすことができ、NEWのエラーの見通しが良くなりました。</p>
<h3 id="%E4%B8%8D%E8%A6%81%E3%81%AA%E9%80%9A%E7%9F%A5%E3%81%AFignore%E3%81%99%E3%82%8B">
<a class="header-anchor-link" href="#%E4%B8%8D%E8%A6%81%E3%81%AA%E9%80%9A%E7%9F%A5%E3%81%AFignore%E3%81%99%E3%82%8B" aria-hidden="true"></a> 不要な通知はignoreする</h3>
<p>通知されていたエラーにはそもそも不要なものが多々ありました。<br>
ブラウザの拡張機能から発生するエラーやユーザーに影響ないと判断できるエラーは通知が来ないようにし、ノイズを減らしました。</p>
<p>Sentryには <a href="https://docs.sentry.io/platforms/javascript/configuration/filtering/#decluttering-sentry" target="_blank" rel="nofollow noopener noreferrer">ignoreErrors</a> というオプションがあります。文字列や正規表現を用いて不要なエラーをフィルタリングできます。</p>
<div class="code-block-container"><pre class="language-jsx"><code class="language-jsx"><span class="token maybe-class-name">Sentry</span><span class="token punctuation">.</span><span class="token method function property-access">init</span><span class="token punctuation">(</span><span class="token punctuation">{</span>
  <span class="token literal-property property">ignoreErrors</span><span class="token operator">:</span> <span class="token punctuation">[</span>
    <span class="token comment">// ブラウザの拡張機能といった外的要因のエラーなど</span>
  <span class="token punctuation">]</span>
<span class="token punctuation">}</span><span class="token punctuation">)</span><span class="token punctuation">;</span>
</code></pre></div><p>通知数を削減できたことで、ノイズ低減だけでなくコスト面にも良い影響を与えました。</p>
<h3 id="slack-%E3%81%B8%E3%81%AE%E3%82%A2%E3%83%A9%E3%83%BC%E3%83%88%E9%80%9A%E7%9F%A5%E3%82%92%E5%88%B6%E9%99%90">
<a class="header-anchor-link" href="#slack-%E3%81%B8%E3%81%AE%E3%82%A2%E3%83%A9%E3%83%BC%E3%83%88%E9%80%9A%E7%9F%A5%E3%82%92%E5%88%B6%E9%99%90" aria-hidden="true"></a> Slack へのアラート通知を制限</h3>
<p>当初は発生したすべてのエラーをSlackに通知していましたが、不要なエラーが多い状態では形骸化し、結局誰も見ないような状態になっていました。<br>
Sentryではアラートの通知条件を設定できます。<a href="https://docs.sentry.io/product/alerts/best-practices/" target="_blank" rel="nofollow noopener noreferrer">Issue Alerts Best Practices</a>というドキュメントが用意されています。</p>
<p>多くの影響を与えているエラーのみ抽出できるよう、条件を「1分間に10回以上発生」に変更しました。この設定により、Slackへの通知 ≒ 比較的大きな影響と判断しやすくなり、重大なエラーを素早く気付けるようになりました。</p>
<h2 id="%E3%82%A8%E3%83%A9%E3%83%BC%E5%86%85%E5%AE%B9%E3%81%8B%E3%82%89%E3%81%AE%E8%AA%BF%E6%9F%BB%E3%81%97%E3%82%84%E3%81%99%E3%81%8F%E3%81%99%E3%82%8B">
<a class="header-anchor-link" href="#%E3%82%A8%E3%83%A9%E3%83%BC%E5%86%85%E5%AE%B9%E3%81%8B%E3%82%89%E3%81%AE%E8%AA%BF%E6%9F%BB%E3%81%97%E3%82%84%E3%81%99%E3%81%8F%E3%81%99%E3%82%8B" aria-hidden="true"></a> エラー内容からの調査しやすくする</h2>
<p>エラーの調査をしやすくするには情報を増やす、範囲を絞ることが大事だと考えています。<br>
以下の3点を取り組みました。</p>
<h3 id="releases-%E6%A9%9F%E8%83%BD%E3%81%AE%E6%B4%BB%E7%94%A8">
<a class="header-anchor-link" href="#releases-%E6%A9%9F%E8%83%BD%E3%81%AE%E6%B4%BB%E7%94%A8" aria-hidden="true"></a> Releases 機能の活用</h3>
<p>Sentryにはリリースごとにエラーを確認できるReleasesという機能があります。<br style="display:none">
<span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__752125ec71388" src="https://embed.zenn.studio/card#zenn-embedded__752125ec71388" data-content="https%3A%2F%2Fdocs.sentry.io%2Fproduct%2Freleases%2F" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://docs.sentry.io/product/releases/" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://docs.sentry.io/product/releases/</a></p>
<p>この機能により、どのリリースのバージョンで起きたか監視しやすくなります。原因のスコープを絞ることができ、調査のしやすさが向上しました。</p>
<h3 id="%E3%82%B3%E3%83%B3%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%92%E6%B8%A1%E3%81%99">
<a class="header-anchor-link" href="#%E3%82%B3%E3%83%B3%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%92%E6%B8%A1%E3%81%99" aria-hidden="true"></a> コンテキストを渡す</h3>
<p>エラー調査の手がかりになる情報を増やすため、Sentryにコンテキストを渡すようにしました。<br style="display:none">
<span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__e0f1f728f98ed" src="https://embed.zenn.studio/card#zenn-embedded__e0f1f728f98ed" data-content="https%3A%2F%2Fdocs.sentry.io%2Fplatforms%2Fjavascript%2Fenriching-events%2Fcontext%2F" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://docs.sentry.io/platforms/javascript/enriching-events/context/" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://docs.sentry.io/platforms/javascript/enriching-events/context/</a></p>
<p>例えばSentryにエラーを送信する際、以下のように <code>tags</code> に情報を加えることで、エラー発生箇所の手がかりになります。</p>
<div class="code-block-container"><pre class="language-jsx"><code class="language-jsx"><span class="token maybe-class-name">Sentry</span><span class="token punctuation">.</span><span class="token method function property-access">captureException</span><span class="token punctuation">(</span><span class="token keyword">new</span> <span class="token class-name">Error</span><span class="token punctuation">(</span><span class="token string">"something went wrong"</span><span class="token punctuation">)</span><span class="token punctuation">,</span> <span class="token punctuation">{</span>
  <span class="token literal-property property">tags</span><span class="token operator">:</span> <span class="token punctuation">{</span> <span class="token literal-property property">section</span><span class="token operator">:</span> <span class="token string">"products"</span> <span class="token punctuation">}</span><span class="token punctuation">,</span>
<span class="token punctuation">}</span><span class="token punctuation">)</span><span class="token punctuation">;</span>
</code></pre></div><p><code>tags</code> の他にも <code>extra</code> や <code>contexts</code>, <code>user</code>, <code>level</code>, <code>fingerprint</code> を渡すことが可能です。</p>
<p>Sentryのダッシュボード上で付与したコンテキストから絞り検索でき、調査に役立っています。</p>
<h3 id="session-replay%E3%81%AE%E5%B0%8E%E5%85%A5">
<a class="header-anchor-link" href="#session-replay%E3%81%AE%E5%B0%8E%E5%85%A5" aria-hidden="true"></a> Session Replayの導入</h3>
<p>上記の取り組みをしても、エラー内容から原因の特定・ユーザーへの影響がわからないものは多々あります。そこで、Session Replayを導入しました。</p>
<p><span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__e45278e305c1e" src="https://embed.zenn.studio/card#zenn-embedded__e45278e305c1e" data-content="https%3A%2F%2Fdocs.sentry.io%2Fproduct%2Fsession-replay%2F" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://docs.sentry.io/product/session-replay/" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://docs.sentry.io/product/session-replay/</a></p>
<p>Session Replayはユーザーの行動をビデオのように再現でき、エラーが発生する前後の様子を視覚的に確認できるツールです。実際は動画が取られている訳ではなく、DOMのスナップショットから作成されています。<br>
DevToolsで見るような以下の情報を確認できるようになります。</p>
<ul>
<li>タイムライン</li>
<li>ユーザの行動リプレイ</li>
<li>console</li>
<li>network</li>
<li>Errors</li>
<li>DOM Events</li>
<li>Memory</li>
</ul>
<p>Session Replayによってそのエラーがユーザーにどの程度影響を与えているのか視覚的に、素早く判断できるようになり、工数削減に繋がりました。<br>
また、視覚的なツールでなければ気づけなかった不具合（例えばエラー時にユーザーに対して適切なアラートを提供できない）を発見できる効果もありました。</p>
<h2 id="%E3%81%BE%E3%81%A8%E3%82%81">
<a class="header-anchor-link" href="#%E3%81%BE%E3%81%A8%E3%82%81" aria-hidden="true"></a> まとめ</h2>
<p>Sentryの運用改善を進めた結果、以前と比べて重大なエラーに気が付きやすく、また調査も行いやすくなる状態に持っていくことができました。運用を改善しながら感じたことでは、Sentryには知らなかった機能が多くあり、新しい機能も日々増えていることでした。運用が継続できるよう、コスト小で効率の良い方法を今後も模索していきます。</p>
<h2 id="%E5%8F%82%E8%80%83">
<a class="header-anchor-link" href="#%E5%8F%82%E8%80%83" aria-hidden="true"></a> 参考</h2>
<p><span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__f0514de9e5809" src="https://embed.zenn.studio/card#zenn-embedded__f0514de9e5809" data-content="https%3A%2F%2Ftech.classi.jp%2Fentry%2F2021%2F03%2F26%2F115500" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://tech.classi.jp/entry/2021/03/26/115500" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://tech.classi.jp/entry/2021/03/26/115500</a></p>
<p><span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__e2c2fbed8389b" src="https://embed.zenn.studio/card#zenn-embedded__e2c2fbed8389b" data-content="https%3A%2F%2Fblog.studysapuri.jp%2Fentry%2F2022%2F10%2F03%2Fteam-sentry-operation" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://blog.studysapuri.jp/entry/2022/10/03/team-sentry-operation" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://blog.studysapuri.jp/entry/2022/10/03/team-sentry-operation</a></p>


Sentry の運用を改善

重大なバグに気付けるようにする

エラー内容からの調査しやすくする

Discussion