安装
使用 Apt 安装
-
配置生产存储库:
$ curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \ && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list \ sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell0"></button>(可选)将存储库配置为使用实验包:
$ sed -i -e '/experimental/ s/^#//g' etc/apt/sources.list.d/nvidia-container-toolkit.list
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell1"></button> -
从存储库更新软件包列表:
$ sudo apt-get update
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell2"></button> -
安装 NVIDIA Container Toolkit 软件包:
$ sudo apt-get install -y nvidia-container-toolkit
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell3"></button>
使用 Yum 或 Dnf 安装
-
配置生产存储库:
$ curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell4"></button>(可选)将存储库配置为使用实验包:
$ sudo yum-config-manager --enable nvidia-container-toolkit-experimental
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell5"></button> -
安装 NVIDIA Container Toolkit 软件包:
$ sudo yum install -y nvidia-container-toolkit
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell6"></button>
使用 Zypper 安装
-
配置生产存储库:
$ sudo zypper ar https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell7"></button>(可选)将存储库配置为使用实验包:
$ sudo zypper modifyrepo --enable nvidia-container-toolkit-experimental
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell8"></button> -
安装 NVIDIA Container Toolkit 软件包:
$ sudo zypper --gpg-auto-import-keys install -y nvidia-container-toolkit
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell9"></button>
配置
先决条件
-
您安装了受支持的容器引擎(Docker、Containerd、CRI-O、Podman)。
-
您安装了 NVIDIA 容器工具包。
配置 Docker
-
使用以下命令配置容器运行时:
nvidia-ctk
$ sudo nvidia-ctk runtime configure --runtime=docker
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell10"></button>该命令修改主机上的文件。 该文件已更新,以便 Docker 可以使用 NVIDIA 容器运行时。
nvidia-ctk
/etc/docker/daemon.json
-
重新启动 Docker 守护程序:
$ sudo systemctl restart docker
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell11"></button>
无根模式
要为在下运行的 Docker 配置容器运行时,请按照下列步骤操作:
-
使用以下命令配置容器运行时:
nvidia-ctk
$ nvidia-ctk runtime configure --runtime=docker --config=$HOME/.config/docker/daemon.json
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell12"></button> -
重新启动 Rootless Docker 守护程序:
$ systemctl --user restart docker
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell13"></button> -
使用以下命令进行配置:
/etc/nvidia-container-runtime/config.toml
sudo nvidia-ctk
$ sudo nvidia-ctk config --set nvidia-container-cli.no-cgroups --in-place
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell14"></button>
配置 containerd(适用于 Kubernetes)
-
使用以下命令配置容器运行时:
nvidia-ctk
$ sudo nvidia-ctk runtime configure --runtime=containerd
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell15"></button>该命令修改主机上的文件。 该文件已更新,以便 containerd 可以使用 NVIDIA 容器运行时。
nvidia-ctk
/etc/containerd/config.toml
-
重新启动 containerd:
$ sudo systemctl restart containerd
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell16"></button>
配置 containerd(用于 nerdctl)
无需其他配置。 你可以只运行 有 root 或没有 root。 您无需为 Kubernetes 运行上述命令。nerdctl run --gpus=all
nvidia-ctk
另请参阅
配置 CRI-O
-
使用以下命令配置容器运行时:
nvidia-ctk
$ sudo nvidia-ctk runtime configure --runtime=crio
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell17"></button>该命令修改主机上的文件。 该文件已更新,以便 CRI-O 可以使用 NVIDIA 容器运行时。
nvidia-ctk
/etc/crio/crio.conf
-
重新启动 CRI-O 守护程序:
$ sudo systemctl restart crio
<button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell18"></button>
配置 Podman
对于 Podman,NVIDIA 建议使用 cdi访问容器中的 NVIDIA 设备。
后续步骤
-
如果您尚未安装 NVIDIA GPU 驱动程序,请安装该驱动程序。 您可以使用发行版的包管理器安装驱动程序,但使用其他安装使用一些方法,例如下载文件安装器。 有关详细信息,请参阅 NVIDIA 驱动程序安装快速入门指南