为支持 GPU 的计算节点安装 GPU 驱动程序

对于使用 NVIDIA 图形处理单元 (Graphics Processing Unit, GPU) 的计算节点(例如 NetApp H610C),需要在 VMware ESXi 中安装 NVIDIA 软件驱动程序,以便提高处理能力。部署使用 GPU 的计算节点后,您需要在支持 GPU 的每个计算节点上执行这些步骤,以便在 ESXi 中安装 GPU 驱动程序。

步骤

  1. 打开浏览器并访问以下 URL 以浏览到 NVIDIA 许可门户:
    https://nvid.nvidia.com/dashboard/
  2. 根据您的环境,将以下驱动程序软件包之一下载到您的计算机:
    vSphere 版本 驱动程序软件包
    vSphere 6.0 NVIDIA-GRID-vSphere-6.0-390.94-390.96-392.05.zip
    vSphere 6.5 NVIDIA-GRID-vSphere-6.5-410.92-410.91-412.16.zip
    vSphere 6.7 NVIDIA-GRID-vSphere-6.7-410.92-410.91-412.16.zip
  3. 在您的计算机上解压缩此驱动程序软件包。
    得到的 .VIB 文件为未压缩的驱动程序文件。
  4. 将 .VIB 驱动程序文件从您的计算机复制到计算节点上运行的 ESXi。以下每个版本的命令示例均假定此驱动程序位于管理主机上的 $HOME/NVIDIA/ESX6.x/ 目录中。在大多数 Linux 分发版中,SCP 实用程序随时可用,而在所有版本的 Windows 中,此实用程序可下载使用:
    选项 描述
    ESXi 6.0 scp $HOME/NVIDIA/ESX6.0/NVIDIA**.vib root@<ESXi_IP_ADDR>:/.
    ESXi 6.5 scp $HOME/NVIDIA/ESX6.5/NVIDIA**.vib root@<ESXi_IP_ADDR>:/.
    ESXi 6.7 scp $HOME/NVIDIA/ESX6.7/NVIDIA**.vib root@<ESXi_IP_ADDR>:/.
  5. 按照以下步骤以 root 身份登录到 ESXi 主机,然后在 ESXi 中安装 NVIDIA vGPU 管理器。
    1. 运行以下命令,以 root 用户身份登录到 ESXi 主机:
      ssh root@<ESXi_IP_ADDRESS>
    2. 运行以下命令,确认当前未安装任何 NVIDIA GPU 驱动程序:
      nvidia-smi
      此命令应返回消息“nvidia-smi: not found”。
    3. 运行以下命令,在此主机上启用维护模式,并从 VIB 文件安装 NVIDIA vGPU 管理器:
      esxcli system maintenanceMode set --enable true
      esxcli software vib install -v /NVIDIA**.vib
      此时应显示消息“Operation finished successfully”。
    4. 运行以下命令,确认所有 8 个 GPU 驱动程序均已列在命令输出中:
      nvidia-smi
    5. 运行以下命令,验证是否已正确安装并加载 NVIDIA vGPU 软件包:
      vmkload_mod -l | grep nvidia
      此命令应返回类似于以下内容的输出:nvidia 816 13808
    6. 运行以下命令以退出维护模式并重新启动此主机:
      esxcli system maintenanceMode set –enable false
      reboot -f
  6. 对使用 NVIDIA GPU 的任何其他新部署的计算节点重复步骤 4-6。
  7. 按照 NVIDIA 文档网站中的说明执行以下任务:
    1. 安装 NVIDIA 许可证服务器。
    2. 为虚拟机子系统配置 NVIDIA vGPU 软件。
    3. 如果您正在虚拟桌面基础架构 (Virtual Desktop Infrastructure, VDI) 环境中使用支持 vGPU 的桌面,请为 VMware Horizon View 配置 NVIDIA vGPU 软件。