sudo systemctl restart docker # 验证 docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi
# 正常输出 GPU 信息 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 450.51.06 Driver Version: 450.51.06 CUDA Version: 11.0 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |===============================+======================+======================| | 0 Tesla T4 On | 00000000:00:1E.0 Off | 0 | | N/A 34C P8 9W / 70W | 0MiB / 15109MiB | 0% Default | | | | N/A | +-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=============================================================================| | No running processes found | +-----------------------------------------------------------------------------+
顺带说一下 nvidia/cuda 提供的 3 种镜像(虽然用不到了)
base: 最基本的运行环境
runtime: 多了一些运行时的库
devel: 最完整.
DockerFile
启用 GPU 支持,TF - CUDA - 驱动版本必须是对应的.
CUDA - 驱动对照表
TF - CUDA 对照表
目前 Ubuntu 稳定版驱动是 450,也就是最高支持到支持 CUDA 11.0.同时这个版本也支持 TF 2.2,这里就维持这个版本对照了.
尝试了 N 多 nvidia-docker 镜像,一直遇到 pip 安装了 tf 还是提示有关的库不全.