还原隔离节点的网络连接

在某些情况下,例如站点范围或网格范围的 IP 地址更改,一组或多组节点可能无法与网格的其余部分联系。

关于本任务

网格管理器中,如果某个节点为灰色,或者某个节点为蓝色,并且其许多服务显示的状态并非 " 正在运行 " ,则应检查节点隔离情况。


屏幕截图
隔离节点会产生以下后果:
  • 如果隔离了多个节点,则可能无法登录或访问 网格管理器
  • 如果隔离了多个节点,则的信息板 租户管理器 上显示的存储使用情况和配额值可能已过时。恢复网络连接后,总数将更新。

要解析隔离问题描述,请在每个节点上或与网格隔离的组中的一个节点上运行命令行实用程序。该实用程序可为节点提供网格中非隔离节点的 IP 地址,从而使隔离的节点或节点组能够再次访问整个网格。

过程

  1. 访问节点并检查 /var/local/log/dynip.log 隔离消息。
     2018 年 1 月 9 日 T19 : 11 : 00.545 ) UpdateQueue - 警告 - 可能的隔离,与其他节点无联系。 
    如果此警告仍然存在,则可能需要手动操作。

    如果您使用的是 VMware 控制台,则它将包含一条消息,指出此节点可能已隔离。

    在 Linux 部署中 /var/log/storagegrid/node/<nodename>.log ,隔离消息将显示在文件中。

  2. 如果隔离消息重复出现且持久,请运行以下命令:
    add_node_ip.py <address>

    其中 <address> 是连接到网格的远程节点的 IP 地址。

    # /usr/sbin/add_node_ip.py 10.224.210
    
    正在检索本地主机信息
    正在验证地址为 10.224.4.210 的远程节点
    将 10.224.4.210 的节点 IP 提示发送到本地节点
    在远程节点上找到本地节点。更新完成。
    
  3. 验证先前隔离的每个节点的以下情况:
    • 节点的服务已启动。
    • 运行 storagegrid status 命令后,动态 IP 服务的状态为 running 。
    • 在网格拓扑树中,节点不再显示为与网格其余部分断开连接。
    注意: 如果运行 add_node_ip.py 命令无法解决此问题,则可能还有其他网络问题需要解决。