Open4
OCI Ubuntu 24.04にNVIDIA GPU DriverとCUDAをインストールする
NVIDIA Driver
ubuntu-drivers-commons をインストールしておく
sudo apt update
sudo apt install ubuntu-drivers-common
確認
sudo ubuntu-drivers --help
以下のような結果が返って来ればOK
Usage: ubuntu-drivers [OPTIONS] COMMAND [ARGS]...
Options:
--gpgpu gpgpu drivers
--free-only Only consider free packages
--package-list PATH Create file with list of installed packages (in install
mode)
--no-oem Do not include OEM enablement packages (these enable an
external archive)
-h, --help Show this message and exit.
Commands:
autoinstall Deprecated, please use "install" instead
debug Print all available information and debug data about drivers.
devices Show all devices which need drivers, and which packages...
install Install a driver [driver[:version][,driver[:version]]]
list Show all driver packages which apply to the current system.
list-oem Show all OEM enablement packages which apply to this system
インストール可能な GPU ドライバー一覧を出力する
sudo ubuntu-drivers --gpgpu list
こんな一覧が見えるはず
nvidia-driver-535, (kernel modules provided by linux-modules-nvidia-535-oracle)
nvidia-driver-550, (kernel modules provided by linux-modules-nvidia-550-oracle)
nvidia-driver-535-server, (kernel modules provided by linux-modules-nvidia-535-server-oracle)
nvidia-driver-550-open, (kernel modules provided by linux-modules-nvidia-550-open-oracle)
nvidia-driver-535-open, (kernel modules provided by linux-modules-nvidia-535-open-oracle)
nvidia-driver-470-server, (kernel modules provided by linux-modules-nvidia-470-server-oracle)
nvidia-driver-535-server-open, (kernel modules provided by linux-modules-nvidia-535-server-open-oracle)
nvidia-driver-470, (kernel modules provided by linux-modules-nvidia-470-oracle)
バージョン指定なしで検出されたものに基づいて適切なドライバーをインストールする
sudo ubuntu-drivers --gpgpu install
再起動する(5分くらいで完了)
sudo shutdown -r now
NVIDIA CUDA
これに則って実施する
以下を順番に実行すればOK
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-6
cuda-samples
cuda-samples を用いてセットアップができたかどうか確認する
まずは、サンプルコードをダウンロードする
git clone https://github.com/NVIDIA/cuda-samples.git
ビルドする
cd cuda-samples; make
cmake
が存在しなかったのでインストールしておく
sudo apt install cmake
再度ビルドする
make
以下がログ出力されればOK
# ...
Finished building CUDA samples
正しくセットアップできているかどうか確認する
./bin/x86_64/linux/release/deviceQuery
# ...
Result = PASS
./bin/x86_64/linux/release/bandwidthTest
# ...
Result = PASS
NOTE: The CUDA Samples are not meant for performance measurements. Results may vary when GPU Boost is enabled.
ちなみに、VM.A10.2(A10が2枚刺さったGPUのVM)で実施