☝️
NVIDIAドライバのアップデート
私は、GPUはDockerで使っているので、CUDAのバージョンは簡単にDockerイメージで切り替えられます。セットアップ方法などは以下記事参照ください。
ただ、CUDAのバージョンが新しいと、NVIDIAのドライバのバージョンが古くて使えないときがあります。
torch.cuda.is_available()
がTrue
にならないといったエラーはその兆候です。
勇気を出してNVIDIAのドライバのバージョンアップをしたので手順をメモします。
sudo apt-get --purge remove nvidia-*
ubuntu-drivers devices
sudo apt install nvidia-driver-535
Dockerを使うには、NVIDIA Dockerも入れ直す必要がありました。
sudo rm /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get install nvidia-container-runtime
curl -s -L https://nvidia.github.io/nvidia-container-runtime/gpgkey | sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.list | sudo tee /etc/apt/sources.list.d/nvidia-container-runtime.list
sudo apt-get update
sudo apt-get install nvidia-container-runtime
service docker restart
一発で動きました。黒画になったらドライバのバージョンを変えると良いです。
参考リンク
Discussion