Closed1
CohoHa VPSでのkernel panicの対処について

経緯
ConoHaのVPSで起動しているサーバに突然繋がらなくなった。
何度か再起動したが復旧せず、再起動後のコンソールからkernel panic
という原因で死んでいるのがわかった。
コンソールに表示されていたエラーメッセージ
[ 1.626243] ? write_buffer+0x43/0x5a
[ 1.626243] ? flush_buffer+0x30/0x8e
[ 1.626243] ? initrd_load+0x48/0x48
[ 1.626243] ? __unzstd.constprop.0+0x353/0x431
[ 1.626243] ? write_buffer+0x5a/0x5a
[ 1.626243] ? __unzstd.constprop.0+0x431/0x431
[ 1.626243] unzstd+0xc/0x12
[ 1.626243] ? initrd_load+0x48/0x48
[ 1.626243] unpack_to_rootfs+0x1fe/0x2c5
[ 1.626243] ? initrd_load+0x48/0x48
[ 1.626243] do_populate_rootfs+0x5e/0x112
[ 1.626243] async_run_entry_fn+0x30/0x120
[ 1.626243] process_one_work+0x228/0x3d0
[ 1.626243] worker_thread+0x53/0x420
[ 1.626243] ? process_one_work+0x3d0/0x3d0
[ 1.626243] kthread+0x127/0x150
[ 1.626243] ? set_kthread_struct+0x50/0x50
[ 1.626243] ret_from_fork+0x1f/0x30
[ 1.626243] <TASK>
[ 1.626243] Kernel Offset: 0x10200000 from 0xffffffff81000000 (relocation range: 0xffffffff80000000-0xfffffffffbffffff)
[ 1.626243] ---[ end Kernel panic - not syncing: System is deadlocked on memory ]---
対応
そもそもコンソールに入れないので対処ができず、サーバを再構築することにした。
踏み台として利用してるだけだったので大した構築も必要なかった。
想定原因
エラーの内容がメモリ関連なので、デバイス絡みかもしれない。
[1]では同じエラーに対してメモリの増築で解決したという報告がある。
今まで使えていたのがなぜ突然死んだのかはわからない。
ubuntuのkernelを定期的にアップデートする設定になっているなら、その辺りも怪しい?
予防法
CohoHaはサーバイメージを保存できるので、動作している状態のイメージを保存しておけば復旧が多少楽になるかもしれない(多分イメージの料金はそんなに高くないはず)。
参考
このスクラップは2023/11/10にクローズされました