🗂

OCIのインスタンスが実行中なのになぜか応答しない

に公開

はじめに

OCI(Oracle Cloud Infrastructure)のインスタンスのステータスが実行中なのにsshや公開しているサービスが応答しなくなるという現象に会いました。

環境

OS: Oracle Linux 8
シェイプ: VM.Standard.E2.1.Micro
OCPUの数: 1
メモリ: 1GB

結論

定期的に実行されるdnf-makecacheがメモリーを吸い尽くしていた。

解決方法

環境は違いますが他の方が記事にしていました。
丁寧に書かれているので以下を参照するのが良いかと思います。
https://zenn.dev/labocho/articles/29120bc9f0e848

経緯

とても雑な図ですがOCIのインスタンスにアクセスが来ると自宅のネットワークのサーバでホストしているサービスにCloudflare Tunnel経由で通信するものを考えていました。

設定を入れて疎通が確認できるようになって数時間後...
なぜかアクセスできない!!!

OCIのコンソールから強制的に再起動してsshでログイン
原因も思いつかないのでとりあえず雑なプロンプトをGeminiに投げてみる

OCI インスタンス 実行中だが応答しない

するとGemini君

とりあえず/var/log/messagesとか/var/log/syslogを見てみればいいんじゃないかなー

OCIのWeb管理画面からモニタリングを見てどの時間から止まっているか見る
/var/log/messagesの時間と照らし合わせる

Starting dnf makecache...ってログがあった後に毎回止まってる!!!

っていう感じでしたね

まとめ

大規模じゃないし個人的に使うものだったのでメモリそんなにいらないだろって思ってたんですけどとりあえずログ見るの大事だなって思いました。
以上

Discussion