👋

トラブルシューティングの際の考え方

に公開

そもそもトラブルって何?
→「あるべき姿」と「現状」に食い違いが起こっている状況のこと

トラブルシューティング時に重要なこと
・事前に「あるべき姿」を把握すること
・「現状」を抜けもれなく、ありのままに把握すること
どちらも欠けないことで初めて正確なトラブルシューティングが出来る。

トラブルシューティング時に困ること
・復旧に時間がかかる→体系的なトラブルシューティングが必要
・原因の特定が出来ない→抜けもれがない対応が必要
・再発する→再発防止策や再発時の対処法を考慮する

トラブルシューティング時の問題解決までの流れとは?
1問題発生
2問題かどうかの確認
3情報取集
4原因の推察
5解決手順の確立
6解決手順の実施
7結果の確認
8ドキュメント化

1~8の詳細は次回以降どっかのタイミングでやります

トラブルシューティングの対処法
・トップダウン方式
→アプリケーションから正常性を確認していき、正常性が確認できた場合、それ以下のレイヤは正常であると言える
・ボトムアップ方式
→物理的な要素から正常性を確認していく
・二分探索(分割統治)方式
→ping疎通を確認し、疎通できればレイヤ1~3は正常であると推定され、そこからボトムアップ方式。疎通できなかった場合は以下のレイヤの正常性を確認する
・トラフィックパス追跡方式
→データの通り道を追跡しながら確認する方式(機器を一つずつたどりながら、各機器間のリンクに問題がないか確認していく)
・設定比較方式
→正常に稼働している機器の設定情報と比較する(設定上の問題解決にはつながるが、それ以外の⦅物理的問題などの⦆問題の解決には至らないのが注意点としてある)
・コンポーネント交換方式
→部分的に、物理的なコンポーネントを他のものに交換して改善するかどうかを確認する
※交換を試したい主な物理コンポーネント
・端末自身(PC,ルータ、スイッチ等)
・ケーブル類(LANケーブル、電源ケーブル等)
・接続ポート

Discussion