Open4

OCI Ubuntu 24.04にNVIDIA GPU DriverとCUDAをインストールする

shukawamshukawam

NVIDIA Driver

ubuntu-drivers-commons をインストールしておく

sudo apt update
sudo apt install ubuntu-drivers-common

確認

sudo ubuntu-drivers --help

以下のような結果が返って来ればOK

Usage: ubuntu-drivers [OPTIONS] COMMAND [ARGS]...

Options:
  --gpgpu              gpgpu drivers
  --free-only          Only consider free packages
  --package-list PATH  Create file with list of installed packages (in install
                       mode)
  --no-oem             Do not include OEM enablement packages (these enable an
                       external archive)
  -h, --help           Show this message and exit.

Commands:
  autoinstall  Deprecated, please use "install" instead
  debug        Print all available information and debug data about drivers.
  devices      Show all devices which need drivers, and which packages...
  install      Install a driver [driver[:version][,driver[:version]]]
  list         Show all driver packages which apply to the current system.
  list-oem     Show all OEM enablement packages which apply to this system

インストール可能な GPU ドライバー一覧を出力する

sudo ubuntu-drivers --gpgpu list

こんな一覧が見えるはず

nvidia-driver-535, (kernel modules provided by linux-modules-nvidia-535-oracle)
nvidia-driver-550, (kernel modules provided by linux-modules-nvidia-550-oracle)
nvidia-driver-535-server, (kernel modules provided by linux-modules-nvidia-535-server-oracle)
nvidia-driver-550-open, (kernel modules provided by linux-modules-nvidia-550-open-oracle)
nvidia-driver-535-open, (kernel modules provided by linux-modules-nvidia-535-open-oracle)
nvidia-driver-470-server, (kernel modules provided by linux-modules-nvidia-470-server-oracle)
nvidia-driver-535-server-open, (kernel modules provided by linux-modules-nvidia-535-server-open-oracle)
nvidia-driver-470, (kernel modules provided by linux-modules-nvidia-470-oracle)

バージョン指定なしで検出されたものに基づいて適切なドライバーをインストールする

sudo ubuntu-drivers --gpgpu install

再起動する(5分くらいで完了)

sudo shutdown -r now
shukawamshukawam

cuda-samples

cuda-samples を用いてセットアップができたかどうか確認する
まずは、サンプルコードをダウンロードする

git clone https://github.com/NVIDIA/cuda-samples.git

ビルドする

cd cuda-samples; make

cmake が存在しなかったのでインストールしておく

sudo apt install cmake

再度ビルドする

make

以下がログ出力されればOK

# ...
Finished building CUDA samples

正しくセットアップできているかどうか確認する

./bin/x86_64/linux/release/deviceQuery
# ...
Result = PASS
./bin/x86_64/linux/release/bandwidthTest
# ...
Result = PASS
NOTE: The CUDA Samples are not meant for performance measurements. Results may vary when GPU Boost is enabled.
shukawamshukawam

ちなみに、VM.A10.2(A10が2枚刺さったGPUのVM)で実施