👻
RTX3090でtensorflow 1.15.5を動かす
Ubuntu20.04, GeForce RTX3090でtensorflow 1.15.5を動かしてみました。ドライバー情報は次のとおりです。
$ nvidia-smi
Wed Mar 9 23:49:24 2022
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 510.47.03 Driver Version: 510.47.03 CUDA Version: 11.6 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA GeForce ... On | 00000000:65:00.0 On | N/A |
| 0% 38C P8 24W / 350W | 169MiB / 24576MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
まずこちらが参考になると思います。
Dockerを使いたいので、リンク先に書かれているイメージをベースにしてみます。FROM nvcr.io/nvidia/tensorflow:20.06-tf1-py3
RUN pip install -U pip
RUN pip install tf-slim==1.1.0
deeplabを使いたいので、次のリポジトリを使います。
学習してみると次のような警告が出ます。W tensorflow/stream_executor/cuda/redzone_allocator.cc:312] Internal: ptxas exited with non-zero error code 65280, output: ptxas fatal : Value 'sm_86' is not defined for option 'gpu-name'
処理自体は止まりませんが、とても遅いです(sm_86
というのはGeForce RTX3080, RTX3090が該当するらしいです)。ベースを現在、最新のnvcr.io/nvidia/tensorflow:22.02-tf1-py3
にすると、今度は上記警告が消え、無事学習できました。最後に今回の学習で得た結果を載せておきます。
結果
入力画像
今回
推論結果
入出力合成
前回
推論結果
入出力合成
Discussion