🐣

AMD GPUでの機械学習の環境構築について

2021/12/18に公開
1

方法

ざっと調べた感じ、以下のような方法がありました。

  1. TensorFlow with DirectML
  2. PyTorch for AMD ROCm Platform
  3. PlaidML

1. TensorFlow with DirectMLの場合

DirectX 12を使用できるすべてのハードウェアがTensorFlowを使ってWindows上で機械学習できるようになります。ただし、TensorFlow自体のバージョンが少し古いものでした。

DirectML with TensorFlowをインストールする

ここではWindowsでの場合について説明します。https://docs.microsoft.com/ja-jp/windows/ai/directml/gpu-tensorflow-windowsに従います。

WSLの場合はhttps://docs.microsoft.com/ja-jp/windows/ai/directml/gpu-tensorflow-wslに従います。

要件

  • Windows 10 バージョン 1709 (ビルド 16299 以降)
  • 最新のGPUドライバー
  • Python 3.5、3.6、または3.7環境とpip
    これはWindowsでTensorFlow with DirectMLを有効にするための要件です。

インストール

公式ではMinicondaで仮想環境を作ることが推奨されていますが、環境ができればpip install tensorflow-directmlを実行します。

2. PyTorch for AMD ROCm Platformの場合

公式のインストール手順はhttps://pytorch.org/get-started/locally/です。2021/12/18時点ではROCm 4.2でのみAMD GPUでPyTorchが利用できました。ROCm 4.2は対応しているOSが古かったです。https://github.com/RadeonOpenCompute/ROCm/tree/roc-4.2.x#rocm-installation-updates

3. PlaidMLの場合

余裕があれば、調べます

Discussion