还原和验证网格节点
您必须还原任何出现故障的网格节点的网格配置文件,然后验证网格配置文件并解决任何错误。
您可以导入主机上应存在的任何网格节点,前提是其 ` 或 var/local` 卷未因上一主机故障而丢失。例如,如果您为 StorageGRID 系统数据卷使用共享存储,则 ` /var/local` 卷可能仍存在,如适用于 Linux 操作系统的 StorageGRID 安装说明中所述。导入节点会将其节点配置文件还原到主机。
如果无法导入缺少的节点,则必须重新创建其网格配置文件。
然后,您必须验证网格配置文件,并解决可能发生的任何网络或存储问题,然后再继续重新启动 StorageGRID 。重新创建节点的配置文件时,必须为要恢复的节点所使用的替代节点使用相同的名称。
有关节点的 ` /var/local` 卷位置的详细信息,请参见安装说明。
-
在已恢复主机的命令行中,列出当前已配置的所有 StorageGRID 网格节点:
sUdo StorageGRID node list
如果未配置网格节点,则不会显示任何输出。如果配置了某些网格节点,则输出格式应为:
Name Metadata-Volume ================================================================ dc1-adm1 /dev/mapper/sgws-adm1-var-local dc1-gw1 /dev/mapper/sgws-gw1-var-local dc1-sn1 /dev/mapper/sgws-sn1-var-local dc1-arc1 /dev/mapper/sgws-arc1-var-local
如果未列出应在主机上配置的部分或全部网格节点,则需要还原缺少的网格节点。
-
要导入具有 ` /var/local` 卷的网格节点,请执行以下操作:
-
对要导入的每个节点运行以下命令:
sUdo StorageGRID node import node-var-local-volume-path
只有当目标节点在上次运行的主机上完全关闭时,
StorageGRID node import
命令才会成功。否则,您将看到类似以下内容的错误:此节点( node-name )似乎归另一主机所有( UUID host-uuid )。
如果您确定导入安全,请使用 -force 标志。
-
如果您看到有关节点归另一主机所有的错误,请使用 ` -force` 标志再次运行命令以完成导入:
sUdo StorageGRID --force node import node-var-local-volume-path
使用 ` -force` 标志导入的任何节点都需要执行额外的恢复步骤,才能重新加入网格,如中所述 下一步操作:如果需要,执行其他恢复步骤。
-
-
对于没有 ` /var/local` 卷的网格节点,请重新创建节点的配置文件以将其还原到主机。
请按照安装说明中 "`Create node configuration files` " 中的准则进行操作。
重新创建节点的配置文件时,必须为要恢复的节点所使用的替代节点使用相同的名称。对于 Linux 部署,请确保配置文件名称包含节点名称。应尽可能使用相同的网络接口,块设备映射和 IP 地址。这种做法可以最大限度地减少恢复期间需要复制到节点的数据量,从而可以显著加快恢复速度(在某些情况下,只需几分钟而不是几周)。 如果在为节点重新创建配置文件时使用任何新的块设备( StorageGRID 节点先前未使用的设备)作为以 block_device_
开头的任何配置变量的值,请务必遵循中的所有准则 修复缺少的块设备错误。 -
在已恢复的主机上运行以下命令以列出所有 StorageGRID 节点。
sUdo StorageGRID 节点列表
-
验证名称显示在 StorageGRID 节点列表输出中的每个网格节点的节点配置文件:
sUdo StorageGRID node validate node-name
在启动 StorageGRID 主机服务之前,您必须解决任何错误或警告。以下各节详细介绍了在恢复期间可能具有特殊意义的错误。