还原和验证网格节点

您必须还原任何出现故障的网格节点的网格配置文件,然后验证网格配置文件并解决任何错误。

关于本任务

您可以导入主机上应存在的任何网格节点 /var/local ,前提是其卷不会因上一主机故障而丢失。例如 /var/localStorageGRIDStorageGRID ,如果您为 StorageGRID 系统数据卷使用共享存储,则该卷可能仍存在,如适用于 Linux 操作系统的 StorageGRID 安装说明中所述。导入节点会将其节点配置文件还原到主机。

如果无法导入缺少的节点,则必须重新创建其网格配置文件。

然后,您必须验证网格配置文件,并解决可能发生的任何网络或存储问题,然后再继续重新启动 StorageGRID。重新创建节点的配置文件时,必须为要恢复的节点所使用的替代节点使用相同的名称。

有关 /var/local 节点的卷位置的详细信息,请参见安装说明。

过程

  1. 在已恢复主机的命令行中,列出当前已配置 StorageGRID 网格节点:sudo storagegrid node list

    如果未配置网格节点,则不会显示任何输出。如果配置了某些网格节点,则输出格式应为:

    名称 元数据卷
    ="="="="="="="="="="=") ="="="="="="="="=") ="="="="="="="=") ="="="="="="="=") ="="="="=="=="=="=="=="=="=="=="=="=="=="=="========================="
    DC1-ad1 /dev/mapper/sgws-ad1-var-local
    DC1-GW1 /dev/mapper/sgws-gw1-var-local
    DC1-SN1 /dev/mapper/sgws-SN1-var-local
    DC1-arc1 /dev/mapper/sgws-arc1-var-local

    如果未列出应在主机上配置的部分或全部网格节点,则需要还原缺少的网格节点。

  2. 要导入具有 /var/local 卷的网格节点,请执行以下操作:
    1. 对要导入的每个节点运行以下命令:sudo storagegrid node import node-var-local-volume-path

      storagegrid node import 只有在目标节点上次运行的主机上已完全关闭时,此命令才会成功。否则,您将看到类似以下内容的错误:

      此节点(node-name)似乎归另一主机( UUID host-uuid)所有。
      
      如果您确定导入安全,请使用 -force 标志。
      
    2. 如果您看到有关节点归其他主机所有的错误,请使用 --force 标志再次运行命令以完成导入:sudo storagegrid --force node import node-var-local-volume-path
      注: 使用 --force 此标志导入的任何节点都需要执行额外的恢复步骤,才能重新加入网格,如 必要时执行其他恢复步骤中所述。
  3. 对于没有 /var/local 卷的网格节点,请重新创建节点的配置文件以将其还原到主机。

    请按照 安装说明中创建节点配置文件中的准则进行操作。

    注意: 重新创建节点的配置文件时,必须为要恢复的节点所使用的替代节点使用相同的名称。对于 Linux 部署,请确保配置文件名称包含节点名称。应尽可能使用相同的网络接口,块设备映射和 IP 地址。这种做法可以最大限度地减少恢复期间需要复制到节点的数据量,从而可以显著加快恢复速度(在某些情况下,只需几分钟而不是几周)。
    注意: 如果您使用任何新的块设备( StorageGRID 节点以前未使用的设备)作为 BLOCK_DEVICE_ 在为节点重新创建配置文件 时以开头的任何配置变量的值,请务必遵循解决缺少的块设备错误的所有准则。
  4. 在已恢复的主机上运行以下命令以列出所有 StorageGRID 节点。
    sudo storagegrid node list
  5. 验证输出中显示了名称的每个网格节点的节点配置文件 storagegrid node list
    sudo storagegrid node validate node-name

    在启动 StorageGRID 主机服务之前,您必须解决任何错误或警告。以下各节详细介绍了在恢复期间可能具有特殊意义的错误。