searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享

NVIDIA容器工具包的安装

2024-08-23 09:39:39
3
0

安装

使用 Apt 安装

  1. 配置生产存储库:

    $ curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
      && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list \
        sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' 
        sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell0"></button>

    (可选)将存储库配置为使用实验包:

    $ sed -i -e '/experimental/ s/^#//g' etc/apt/sources.list.d/nvidia-container-toolkit.list
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell1"></button>
  2. 从存储库更新软件包列表:

    $ sudo apt-get update
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell2"></button>
  3. 安装 NVIDIA Container Toolkit 软件包:

    $ sudo apt-get install -y nvidia-container-toolkit
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell3"></button>

使用 Yum 或 Dnf 安装

  1. 配置生产存储库:

    $ curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo 
      sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell4"></button>

    (可选)将存储库配置为使用实验包:

    $ sudo yum-config-manager --enable nvidia-container-toolkit-experimental
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell5"></button>
  2. 安装 NVIDIA Container Toolkit 软件包:

    $ sudo yum install -y nvidia-container-toolkit
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell6"></button>

使用 Zypper 安装

  1. 配置生产存储库:

    $ sudo zypper ar https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell7"></button>

    (可选)将存储库配置为使用实验包:

    $ sudo zypper modifyrepo --enable nvidia-container-toolkit-experimental
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell8"></button>
  2. 安装 NVIDIA Container Toolkit 软件包:

    $ sudo zypper --gpg-auto-import-keys install -y nvidia-container-toolkit
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell9"></button>

配置

先决条件

  • 您安装了受支持的容器引擎(Docker、Containerd、CRI-O、Podman)。

  • 您安装了 NVIDIA 容器工具包。

配置 Docker

  1. 使用以下命令配置容器运行时:nvidia-ctk

    $ sudo nvidia-ctk runtime configure --runtime=docker
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell10"></button>

    该命令修改主机上的文件。 该文件已更新,以便 Docker 可以使用 NVIDIA 容器运行时。nvidia-ctk/etc/docker/daemon.json

  2. 重新启动 Docker 守护程序:

    $ sudo systemctl restart docker
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell11"></button>

无根模式

要为在下运行的 Docker 配置容器运行时,请按照下列步骤操作:

  1. 使用以下命令配置容器运行时:nvidia-ctk

    $ nvidia-ctk runtime configure --runtime=docker --config=$HOME/.config/docker/daemon.json
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell12"></button>
  2. 重新启动 Rootless Docker 守护程序:

    $ systemctl --user restart docker
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell13"></button>
  3. 使用以下命令进行配置:/etc/nvidia-container-runtime/config.tomlsudo nvidia-ctk

    $ sudo nvidia-ctk config --set nvidia-container-cli.no-cgroups --in-place
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell14"></button>

配置 containerd(适用于 Kubernetes)

  1. 使用以下命令配置容器运行时:nvidia-ctk

    $ sudo nvidia-ctk runtime configure --runtime=containerd
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell15"></button>

    该命令修改主机上的文件。 该文件已更新,以便 containerd 可以使用 NVIDIA 容器运行时。nvidia-ctk/etc/containerd/config.toml

  2. 重新启动 containerd:

    $ sudo systemctl restart containerd
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell16"></button>

配置 containerd(用于 nerdctl)

无需其他配置。 你可以只运行 有 root 或没有 root。 您无需为 Kubernetes 运行上述命令。nerdctl run --gpus=allnvidia-ctk

另请参阅 

配置 CRI-O

  1. 使用以下命令配置容器运行时:nvidia-ctk

    $ sudo nvidia-ctk runtime configure --runtime=crio
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell17"></button>

    该命令修改主机上的文件。 该文件已更新,以便 CRI-O 可以使用 NVIDIA 容器运行时。nvidia-ctk/etc/crio/crio.conf

  2. 重新启动 CRI-O 守护程序:

    $ sudo systemctl restart crio
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell18"></button>

配置 Podman

对于 Podman,NVIDIA 建议使用 cdi访问容器中的 NVIDIA 设备。

后续步骤

  • 如果您尚未安装 NVIDIA GPU 驱动程序,请安装该驱动程序。 您可以使用发行版的包管理器安装驱动程序,但使用其他安装使用一些方法,例如下载文件安装器。 有关详细信息,请参阅 NVIDIA 驱动程序安装快速入门指南

0条评论
0 / 1000
王****锋
4文章数
0粉丝数
王****锋
4 文章 | 0 粉丝
王****锋
4文章数
0粉丝数
王****锋
4 文章 | 0 粉丝

NVIDIA容器工具包的安装

2024-08-23 09:39:39
3
0

安装

使用 Apt 安装

  1. 配置生产存储库:

    $ curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
      && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list \
        sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' 
        sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell0"></button>

    (可选)将存储库配置为使用实验包:

    $ sed -i -e '/experimental/ s/^#//g' etc/apt/sources.list.d/nvidia-container-toolkit.list
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell1"></button>
  2. 从存储库更新软件包列表:

    $ sudo apt-get update
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell2"></button>
  3. 安装 NVIDIA Container Toolkit 软件包:

    $ sudo apt-get install -y nvidia-container-toolkit
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell3"></button>

使用 Yum 或 Dnf 安装

  1. 配置生产存储库:

    $ curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo 
      sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell4"></button>

    (可选)将存储库配置为使用实验包:

    $ sudo yum-config-manager --enable nvidia-container-toolkit-experimental
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell5"></button>
  2. 安装 NVIDIA Container Toolkit 软件包:

    $ sudo yum install -y nvidia-container-toolkit
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell6"></button>

使用 Zypper 安装

  1. 配置生产存储库:

    $ sudo zypper ar https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell7"></button>

    (可选)将存储库配置为使用实验包:

    $ sudo zypper modifyrepo --enable nvidia-container-toolkit-experimental
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell8"></button>
  2. 安装 NVIDIA Container Toolkit 软件包:

    $ sudo zypper --gpg-auto-import-keys install -y nvidia-container-toolkit
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell9"></button>

配置

先决条件

  • 您安装了受支持的容器引擎(Docker、Containerd、CRI-O、Podman)。

  • 您安装了 NVIDIA 容器工具包。

配置 Docker

  1. 使用以下命令配置容器运行时:nvidia-ctk

    $ sudo nvidia-ctk runtime configure --runtime=docker
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell10"></button>

    该命令修改主机上的文件。 该文件已更新,以便 Docker 可以使用 NVIDIA 容器运行时。nvidia-ctk/etc/docker/daemon.json

  2. 重新启动 Docker 守护程序:

    $ sudo systemctl restart docker
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell11"></button>

无根模式

要为在下运行的 Docker 配置容器运行时,请按照下列步骤操作:

  1. 使用以下命令配置容器运行时:nvidia-ctk

    $ nvidia-ctk runtime configure --runtime=docker --config=$HOME/.config/docker/daemon.json
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell12"></button>
  2. 重新启动 Rootless Docker 守护程序:

    $ systemctl --user restart docker
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell13"></button>
  3. 使用以下命令进行配置:/etc/nvidia-container-runtime/config.tomlsudo nvidia-ctk

    $ sudo nvidia-ctk config --set nvidia-container-cli.no-cgroups --in-place
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell14"></button>

配置 containerd(适用于 Kubernetes)

  1. 使用以下命令配置容器运行时:nvidia-ctk

    $ sudo nvidia-ctk runtime configure --runtime=containerd
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell15"></button>

    该命令修改主机上的文件。 该文件已更新,以便 containerd 可以使用 NVIDIA 容器运行时。nvidia-ctk/etc/containerd/config.toml

  2. 重新启动 containerd:

    $ sudo systemctl restart containerd
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell16"></button>

配置 containerd(用于 nerdctl)

无需其他配置。 你可以只运行 有 root 或没有 root。 您无需为 Kubernetes 运行上述命令。nerdctl run --gpus=allnvidia-ctk

另请参阅 

配置 CRI-O

  1. 使用以下命令配置容器运行时:nvidia-ctk

    $ sudo nvidia-ctk runtime configure --runtime=crio
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell17"></button>

    该命令修改主机上的文件。 该文件已更新,以便 CRI-O 可以使用 NVIDIA 容器运行时。nvidia-ctk/etc/crio/crio.conf

  2. 重新启动 CRI-O 守护程序:

    $ sudo systemctl restart crio
    
    <button class="copybtn o-tooltip--left" data-tooltip="Copy" data-clipboard-target="#codecell18"></button>

配置 Podman

对于 Podman,NVIDIA 建议使用 cdi访问容器中的 NVIDIA 设备。

后续步骤

  • 如果您尚未安装 NVIDIA GPU 驱动程序,请安装该驱动程序。 您可以使用发行版的包管理器安装驱动程序,但使用其他安装使用一些方法,例如下载文件安装器。 有关详细信息,请参阅 NVIDIA 驱动程序安装快速入门指南

文章来自个人专栏
AI推理服务
3 文章 | 1 订阅
0条评论
0 / 1000
请输入你的评论
0
0