🧰

【OpenShift】クラスター全体の健全性を確認

2024/11/10に公開

0.はじめに

OpenShift Container Platform(以下、OCP)入門者向けに、OpenShiftのリソースとクラスターのステータス調査方法について解説します。

リソースとクラスターのステータス調査は、クラスターの健全性や安定性を保つために、重要なコンポーネントやバージョンの状態を定期的に確認するプロセスです。

特に、etcdOperatorの監視、およびクラスターのバージョン確認は、OpenShift環境を管理するうえで不可欠。

各項目の説明とともに、具体的なCLIコマンドの使用例とその結果の解釈を紹介します。

では、次の章から具体的な解説を進めます!

1. etcdの監視

etcdは、クラスターの状態を保存する分散データストアで、クラスター全体の設定や構成情報を管理する役割を果たします。etcdの状態が不安定だと、クラスター全体の操作に影響を及ぼすため、定期的な監視が重要です。

コマンド例1: etcd Podの確認

oc get pods -n openshift-etcd

実行結果の例:

NAME                    READY   STATUS    RESTARTS   AGE
etcd-crc                1/1     Running   0          5d
etcd-quorum-guard-9jxyz 1/1     Running   0          5d
  • STATUSRunning になっていることを確認します。CrashLoopBackOffPendingなどの状態が表示されている場合は、etcdの動作に問題がある可能性があります。

コマンド例2: etcdコンテナに接続して健康状態を確認

oc -n openshift-etcd rsh etcd-crc
etcdctl endpoint health

実行結果の例:

https://etcd-crc.openshift-etcd.svc:2379 is healthy: successfully committed proposal: took = 2.335ms
  • is healthy と表示されていれば、etcdが正常に稼働しています。ここで遅延が発生したり、エラーメッセージが表示されたりする場合は、etcdの負荷やクラスター内での接続問題の可能性があるため、調査が必要です。

コマンド例3: etcdログの確認

oc logs -n openshift-etcd etcd-crc
  • etcdのエラーログやワーニングがないか確認します。たとえば、接続エラーやデータ保存に関するエラーがある場合、etcdの稼働に問題が発生していることを示します。

2. Operatorの監視

Operatorは、OpenShiftの重要なコンポーネント(APIサーバー、ネットワーク、ストレージなど)の管理と更新を行います。Operatorの状態を監視することで、クラスター内の各コンポーネントが適切に動作しているかを確認できます。

コマンド例: クラスターOperatorの状態を確認

oc get clusteroperators

実行結果の例:

NAME                                       VERSION   AVAILABLE   PROGRESSING   DEGRADED   SINCE
authentication                             4.10.9    True        False         False      1d
cloud-credential                           4.10.9    True        False         False      1d
console                                    4.10.9    True        False         False      1d
etcd                                       4.10.9    True        False         False      1d
network                                    4.10.9    True        False         False      1d
  • AVAILABLETrue であり、PROGRESSINGDEGRADEDFalse であることが正常な状態です。
  • PROGRESSINGTrue の場合、Operatorがアップグレード中または再構成中であることを意味し、DEGRADEDTrue である場合、エラーや不具合が発生していることを示します。こうした問題が見られる場合、さらなるトラブルシューティングが必要です。

3. バージョン確認

クラスターのバージョンを確認することで、現在のOpenShiftおよびKubernetesのバージョンがわかります。バージョンは、互換性や機能を確認するために重要です。

コマンド例: クラスターとCLIのバージョン確認

oc version

実行結果の例:

Client Version: 4.10.9
Server Version: 4.10.9
Kubernetes Version: v1.21.1+abcdef
  • Client Version はCLIのバージョン、Server Version はOpenShiftクラスターのバージョン、Kubernetes Version は基盤となるKubernetesのバージョンです。
  • クライアントとサーバーのバージョンが異なる場合、一部の機能に互換性の問題が生じる可能性があるため、特にServer Versionの確認が重要です。

4.Webコンソールでの監視方法

1. etcdやOperatorの監視

  • Webコンソールにログインし、「監視」→「ダッシュボード」にアクセス。
  • クラスターの健全性ステータスが表示され、etcdやOperatorの異常がある場合は通知されます。
  • コンポーネントの状態」セクションでOperatorの状態を確認できます。

2. バージョン確認

  • Webコンソールの「クラスター設定」ページに移動し、OpenShiftクラスターのバージョンと各コンポーネントのバージョンが表示されます。
  • クラスターのバージョンアップデートが可能な場合、バージョン情報の横に更新通知が表示されます。

5.おわりに

今回はOpenShiftのリソースとクラスターのステータス調査方法について理解を深めるために、以下を学びました。

  • etcdの監視: クラスターの中核であるetcdのPod状態、健康状態、ログを定期的に確認します。
  • Operatorの監視: 各コンポーネントの健全性を確保するため、oc get clusteroperators で確認します。
  • バージョン確認: クライアントとサーバーのバージョンを把握し、互換性を確認するために oc version を使用します。

1回で覚えるのは難しいと思うので、何度かトライして覚えるで全然大丈夫です。

今後もOpenShiftについて解説していきます。

おわりっ!

参考サイト

Discussion