🐨

ROCm(5.4.2) Setup with Pytorch(日・En:Procedure)

2023/06/06に公開

Target of this document(目的)

  • Procedure of installation ROCm on Ubuntu
  • Tested Ubuntu version is 22.04.2
  • ROCm version is 5.4.2
    • English setting + Location is Japan.
    • Show public but install procedure will be old soon. That's why share Zenn is best platform for me.

Reference(参照先)

https://gpuopen.com/learn/amd-lab-notes/amd-lab-notes-rocm-installation-readme/#

If you want to use specific version, Please check this link

  • ファイル一覧です。見やすくはないですが、究極的にはここを辿るか他の解説に沿うかですね…

https://repo.radeon.com/amdgpu/

pkgAcquire::Run (13: エラー対策 permission issue

https://zenn.dev/yashikota/articles/f2e38e1c4e2fb5

  • rocm-llvm debパッケージダウンロード(日本語は以下解説がおすすめ)

https://zenn.dev/oishigyunyu/articles/3064fb644c51bf

https://pytorch.org/

Procedure

日本語で概要
  1. oishigyunyuさんの記事参照:ドライバーをインストールする
  • まずこちらの手順でバージョンが古くてもセットアップした方が手詰まりないです。
  1. ファイル類とダウンロード後、セットアップ前にこたさんの記事のコマンド実行
  2. インストール結果確認
  • こちらはPytorchのバージョンが今回の目的に合わないので最終的にメイン記事のコマンドを実行していきます。
English
  1. ROCm llvm driver install
Terminal
# If you need editting control file

Package: rocm-llvm
Architecture: amd64
Section: devel
Priority: optional
Maintainer: ROCm Compiler Support <rocm.compiler.support@amd.com>
Version: 14.0.0.22204.50200-65
Release:    65
Depends: python3, libc6, libstdc++6|libstdc++8, libstdc++-5-dev|libstdc++-7-dev|libstdc++-10-dev, libgcc-5-dev|libgcc-7-dev|libgcc-10-dev, rocm-core
Provides: llvm-amdgpu
Recommends: gcc, g++, gcc-multilib, g++-multilib
Description: ROCm compiler
  ROCm compiler based on LLVM 14.0.0

You can find helpful comment in the forum.

https://github.com/RadeonOpenCompute/ROCm/issues/1713#issuecomment-1193332549

Terminal

tar c postinst prerm control | xz -c > control.tar.xz

ar rcs rocm-llvm_14.0.0.22204.50200-65_amd64.deb debian-binary control.tar.xz data.tar.xz

  1. To avoid install failure, execute below command.
Terminal
sudo chown _apt /var/lib/update-notifier/package-data-downloads/partial/

  1. check install result
  2. version up driver to install Pytorch applicable ROCm

Driver Donload and install

  • If you prefer to specific version, you can choose from repository.
Terminal


sudo apt-get install libstdc++-10-dev libgcc-10-dev
sudo apt install rocm-core

wget https://repo.radeon.com/amdgpu/5.4.2/ubuntu/pool/main/a/amdgpu-install/amdgpu-install_5.4.50402-1528701.22.04_all.deb 

sudo apt-get install ./amdgpu-install_5.4.50402-1528701.22.04_all.deb

gpu setting and install result check

Terminal
sudo amdgpu-install --usecase=hiplibsdk,rocm,dkms

sudo amdgpu-install --list-usecase
sudo usermod -a -G render $LOGNAME
sudo usermod -a -G video $LOGNAME

#check Status:インストール環境確認

/opt/rocm/bin/rocminfo

ROCm version確認

Terminal
apt show rocm-libs -a

Pytorch install インストール

Terminal(例)
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.4.2

Terminal(例)

~/Desktop$ pip list
Package             Version
------------------- ----------------
certifi             2022.12.7
charset-normalizer  2.1.1
cmake               3.25.0
filelock            3.9.0
idna                3.4
Jinja2              3.1.2
lit                 15.0.7
MarkupSafe          2.1.2
mpmath              1.2.1
networkx            3.0
numpy               1.24.3
Pillow              9.3.0
pip                 23.0.1
pytorch-triton-rocm 2.0.1
requests            2.28.1
setuptools          67.8.0
sympy               1.11.1
torch               2.0.1+rocm5.4.2
torchaudio          2.0.2+rocm5.4.2
torchvision         0.15.2+rocm5.4.2
typing_extensions   4.4.0
urllib3             1.26.13
wheel               0.38.4

  • pytorch-triton-rocmと表示されており、CUDAの"torch"とは違うことが分かります。

ROCm status viewer.ステータスを簡易表示(nvidia-smiみたいにはカッコよくない…)

https://github.com/mi-kaneyon/rocm_util

Additional tool release(8th June 2023)

  • Added ROCm power loader release.
  • Very simple using pytorch and Resnet-50 model
  • CLIベースの負荷だけかけるプログラムです。

https://github.com/mi-kaneyon/rocm_lpoweroading

Discussion