Skip to main content
BeeGFS on NetApp with E-Series Storage
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

替换文件节点

贡献者

如果原始服务器出现故障、请更换文件节点。

概述

本节概述了更换集群中的文件节点所需的步骤。以下步骤假定文件节点因硬件问题描述 而失败、并替换为新的相同文件节点。

步骤

  1. 物理更换文件节点、并还原到块节点和存储网络的所有布线。

  2. 在文件节点上重新安装操作系统、包括添加Red Hat订阅。

  3. 在文件节点上配置管理和BMC网络。

  4. 如果主机名、IP、PCIe到逻辑接口映射或有关新文件节点的任何其他更改、请更新Ansible清单。通常、如果节点已更换为相同的服务器硬件、而您使用的是原始网络配置、则不需要执行此操作。

    1. 例如、如果主机名发生更改、请创建(或重命名)节点的清单文件 (host_vars/<NEW_NODE>.yml`)、然后在Ansible清单文件中 (inventory.yml)、将旧节点的名称替换为新节点名称:

      all:
          ...
          children:
          ha_cluster:
              children:
              mgmt:
                  hosts:
                  node_h1_new:   # Replaced "node_h1" with "node_h1_new"
                  node_h2:
  5. 从集群中的其他一个节点中、删除旧节点: pcs cluster node remove <HOSTNAME>

    重要说明 请勿在运行此步骤之前继续操作。
  6. 在Ansible控制节点上:

    1. 使用删除旧SSH密钥:

      `ssh-keygen -R <HOSTNAME_OR_IP>`
    2. 使用以下命令为替换节点配置无密码SSH:

      ssh-copy-id <USER>@<HOSTNAME_OR_IP>
  7. 重新运行Ansible攻略手册以配置节点并将其添加到集群:

    ansible-playbook -i <inventory>.yml <playbook>.yml
  8. 此时、请运行 pcs status 并验证已更换的节点现在是否已列出并正在运行服务。