您可根据如下操作步骤自行安装Tesla驱动,如要安装CUDA工具包请参见安装CUDA-GPU云主机-最佳实践 - 天翼云 (ctyun.cn)。
选择驱动版本请参见如何选择驱动及相关库、软件版本-GPU云主机-最佳实践 - 天翼云 (ctyun.cn)。
前提条件
- GPU云主机未安装驱动。
- GPU云主机配备弹性IP。
一 、Centos 驱动安装
1.下载对应驱动。访问NVIDIA驱动下载官网,选择对应GPU型号、操作系统和CUDA Toolkit版本后,进行下载,本文以 A100 为例,如下图所示。
2.点击搜索,选择要下载的驱动版本,点击下载。
3.将下载的驱动安装包上传到云主机中,执行以下命令,对安装包添加执行权限。
例如,对文件名为NVIDIA-Linux-x86_64-470.199.02.run添加执行权限。
chmod +x NVIDIA-Linux-x86_64-470.199.02.run
4.安装kernel-devel、gcc包,注意kernel-devel版本要和内核版本保持一致。
sudo yum install -y gcc kernel-devel
5.执行以下命令,运行驱动安装程序,并按提示进行后续操作。
sudo sh NVIDIA-Linux-x86_64-418.126.02.run --disable-nouveau --kernel-source-path=/usr/src/kernels/$(uname -r)
6.安装完成后,执行以下命令进行验证。
nvidia-smi
如返回信息类似下图中的 GPU 信息,则说明驱动安装成功。
二 、Ubuntu 驱动安装
1.下载对应驱动。访问NVIDIA驱动下载官网,选择对应GPU型号、操作系统和CUDA Toolkit版本后,进行下载,本文以 A100 为例,如下图所示。
2.点击搜索,选择要下载的驱动版本,点击下载。
3.将下载的驱动安装包上传到云主机中,执行以下命令,对安装包添加执行权限。 例如,对文件名为NVIDIA-Linux-x86_64-470.199.02.run添加执行权限。
chmod +x NVIDIA-Linux-x86_64-470.199.02.run
4.安装gcc和linux-kernel-headers。
sudo apt-get install gcc linux-kernel-headers
5.执行以下命令,运行驱动安装程序,并按提示进行后续操作。
sudo sh NVIDIA-Linux-x86_64-418.126.02.run --disable-nouveau
6.安装完成后,执行以下命令进行验证。
nvidia-smi
如返回信息类似下图中的 GPU 信息,则说明驱动安装成功。
三 、Windows 驱动安装
1.下载对应驱动。在GPU云主机内访问NVIDIA驱动下载官网,选择对应GPU型号、操作系统和CUDA Toolkit版本后,进行下载,本文以 A100 为例,如下图所示。
2.点击搜索,选择要下载的驱动版本,点击下载。
3 打开下载驱动程序所在的文件夹,双击安装文件开始安装,按照界面上的提示安装驱动程序并根据需要重启GPU云主机。
4.安装完成后查看设备管理器,显示如下则表示驱动安装成功。