👻

RTX3090でtensorflow 1.15.5を動かす

2022/03/10に公開

Ubuntu20.04, GeForce RTX3090でtensorflow 1.15.5を動かしてみました。ドライバー情報は次のとおりです。

$ nvidia-smi 
Wed Mar  9 23:49:24 2022       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 510.47.03    Driver Version: 510.47.03    CUDA Version: 11.6     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  On   | 00000000:65:00.0  On |                  N/A |
|  0%   38C    P8    24W / 350W |    169MiB / 24576MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               

まずこちらが参考になると思います。
https://zenn.dev/pinto0309/articles/9e54ee8d15189a
Dockerを使いたいので、リンク先に書かれているイメージをベースにしてみます。

FROM nvcr.io/nvidia/tensorflow:20.06-tf1-py3
RUN pip install -U pip
RUN pip install tf-slim==1.1.0

deeplabを使いたいので、次のリポジトリを使います。
https://github.com/tensorflow/models
学習してみると次のような警告が出ます。

W tensorflow/stream_executor/cuda/redzone_allocator.cc:312] Internal: ptxas exited with non-zero error code 65280, output: ptxas fatal   : Value 'sm_86' is not defined for option 'gpu-name'

処理自体は止まりませんが、とても遅いです(sm_86というのはGeForce RTX3080, RTX3090が該当するらしいです)。ベースを現在、最新のnvcr.io/nvidia/tensorflow:22.02-tf1-py3にすると、今度は上記警告が消え、無事学習できました。最後に今回の学習で得た結果を載せておきます。

結果


入力画像

今回


推論結果

入出力合成

前回


推論結果

入出力合成

Discussion