インシデントコマンダー用のAIエージェントをリリースしました。
プロダクトサイト
プロダクト開発の背景
私、Brownは新卒でソフトウェアエンジニアになってから一貫して障害対応を気合いと、持ち前のフットワークの軽さでなんとかする活動をしてきて、気づいたら今年30歳になっていました。最近だと、昨年のDatadog Summit Tokyoの信頼性向上の実践で登壇したりなど、特にお客さまとの信頼性向上を通じた活動にモチベーションが高いです。
その活動の中で、特にインシデントコマンダーの役割って、情報をあらゆる経路からかき集めて、その時に得られている情報と、過去の累積情報から即座に判断して、「その時点で考えられる中で最もマシな選択肢を選んでいく」という活動が多く、そもそもの情報整理能力に加えて、不確実性がめちゃくちゃ高い中で意思決定して、自分の意思決定に説明責任を果たすことが求められるので、属人性が高くなりがちだなと思ってました。
そこに、LLMという言語化の塊がやってきたので、「LLMでインシデント対応の旗振りはできるのか?」というのを以前から実験してきて、ようやく実用に至りました。
プロダクト紹介
インシデント対応、ちゃんと仕組み化できていますか?
Webサービスを運用していると、インシデント対応は避けて通れません。
初動の判断から、関係者への連携、調査・復旧、ポストモーテムの作成まで、その対応には多くの工数と属人的なナレッジが必要です。
実際の現場では以下のような課題を耳にすることが少なくありません。
- 経験のあるメンバーがいないと対応できない
- インシデントごとに対応品質やスピードにばらつきがある
- 過去の事例が社内に埋もれてしまっている
- ポストモーテムを書ききれず対応が終了してしまう
このように、インシデントマネジメントは属人化しやすく、再現性のないプロセスになりがちです。
SIGQのアプローチ:AIでインシデントの意思決定をサポートする
SIGQでは「再現性を持ってインシデント対応できる仕組み」を構築することを目指しています。
私がSREとして複数のSaaS企業における障害対応の体制構築や運用に従事してきた経験から得られた知見をもとに本プロダクトを設計しました。
SIGQ Incident Management(SIGQ Copilot)とは?
SIGQ Incident Managementは、LLMとRAG(検索拡張生成)を活用したインシデント対応支援ツールです。
企業ごとに蓄積されたナレッジを活かし、以下のような機能を提供します。
- インシデント発生時の自動初動支援
- 関係者への連携メッセージの自動生成と共有ログの整形
- 過去のインシデントからの類似事例検索と対処案の提案
- ポストモーテムの自動ドラフト生成
- 個人情報漏洩など、法令対応が必要なケースでの初期対応案・通知文案の提示
これらの機能により、従来は人力で行われていた対応を最大で1/10程度まで省力化することを目指しています。
SIGQ Incident Managementのカバー範囲
本サービスでは、エンジニアではなくBiz寄りのインシデント対応者の作業をサポートすることを目的としており、意図的に調査や開発を行うエンジニアは対象としていません。
というのも、エンジニア用のツールにする場合、DatadogなどのメトリクスやAlert、GitHubやArgoCDなどのデプロイツールとフルで連携して、「デプロイした時のXXのコードがミスってて影響が起きた」等のサポートができるツールにする必要があるのですが、そこはすでにモニタリングツール系の会社がこぞってやっているので、そこは先駆者たちに任せて、私はよりニッチな方向かつ、確実にFounder Market Fitする場所にスコープを絞ってます。
プライベートリリース中の取り組みと今後の展開
現在は、スタートアップおよびエンタープライズ企業数社とともにプライベートリリースとして試験導入を行っております。
現場からのフィードバックをもとに、機能改善やUI/UXのブラッシュアップを継続しています。
今後は以下の展開を予定しています
- Google Cloud / AWSのマルチリージョン対応(US含む)
- 英語対応の強化とグローバルチーム向け最適化
- 海外SaaSやインフラ事業者とのパートナーシップ構築
プレビュー利用・デモのご案内
SIGQ Incident Managementのデモをご希望の方、またプレビューへのご参加を検討されている方は、以下のフォームよりご連絡ください。
最後に
SIGQ Incident Managementは、調査をするエンジニアではなく、Biz寄りのインシデントコマンダーをサポートするインシデント対応支援ツールを目指しています。
Slackに埋もれた知見や、暗黙的な判断基準をAIの力で可視化・再利用可能にすることで、どんなチームでも一定品質のインシデントレスポンスが可能になる世界をつくりたいと考えています。
開発者視点で見ても、今後さらに技術的な取り組み(ナレッジベースの設計、Slack連携、インシデントモデルの構造化、etc.)を積極的に公開していく予定です。ぜひウォッチしていただければ幸いです。
Discussion