☝️

NVIDIAドライバのアップデート

2024/01/24に公開

私は、GPUはDockerで使っているので、CUDAのバージョンは簡単にDockerイメージで切り替えられます。セットアップ方法などは以下記事参照ください。

https://qiita.com/karaage0703/items/e79a8ad2f57abc6872aa

ただ、CUDAのバージョンが新しいと、NVIDIAのドライバのバージョンが古くて使えないときがあります。

torch.cuda.is_available()Trueにならないといったエラーはその兆候です。

勇気を出してNVIDIAのドライバのバージョンアップをしたので手順をメモします。

sudo apt-get --purge remove nvidia-*
ubuntu-drivers devices 
sudo apt install nvidia-driver-535

Dockerを使うには、NVIDIA Dockerも入れ直す必要がありました。

sudo rm /etc/apt/sources.list.d/nvidia-docker.list 
sudo apt-get install nvidia-container-runtime
curl -s -L https://nvidia.github.io/nvidia-container-runtime/gpgkey | sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.list | sudo tee /etc/apt/sources.list.d/nvidia-container-runtime.list
sudo apt-get update
sudo apt-get install nvidia-container-runtime
service docker restart

一発で動きました。黒画になったらドライバのバージョンを変えると良いです。

参考リンク

https://qiita.com/nabenabe0928/items/7962dcf3030889667de4

https://qiita.com/murakamixi/items/5f6cf5c1ab6b4090f64a

Discussion