简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

运行: AI 安装

提供者 kevin-hoke

要安装 Run : AI ,请完成以下步骤:

  1. 使用 DeepOps 安装 Kubernetes 集群并配置 NetApp 默认存储类。

  2. 准备 GPU 节点:

    1. 验证是否已在 GPU 节点上安装 NVIDIA 驱动程序。

    2. 验证是否已安装 nvidia-Docker 并将其配置为默认 Docker 运行时。

  3. 安装运行: AI :

    1. 登录到 "运行: AI 管理员 UI" 以创建集群。

    2. 下载创建的 runai-operator-<clustername>.yaml 文件。

    3. 将操作员配置应用于 Kubernetes 集群。

      kubectl apply -f runai-operator-<clustername>.yaml
  4. 验证安装。

    1. 转至 "https://app.run.ai/"

    2. 转到 " 概述 " 信息板。

    3. 验证右上角的 GPU 数量是否反映了预期的 GPU 数量,并且 GPU 节点均位于服务器列表中。有关 Run : AI 部署的详细信息,请参见 "在内部 Kubernetes 集群上安装 Run : AI" 和。