Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

恢复隔离节点的网络连接

贡献者

在某些情况下、一组或多组节点可能无法访问网格的其余部分。例如、站点范围或网格范围的IP地址更改可能导致节点彼此隔离。

关于此任务

节点隔离通过以下方式表示:

  • 警报,例如*无法与节点*通信(警报>*当前*)

  • 与连接相关的诊断(support>*工具*>*诊断*)

隔离节点会产生以下后果:

  • 如果隔离了多个节点,您可能无法登录或访问网格管理器。

  • 如果隔离多个节点、则租户管理器信息板上显示的存储使用情况和配额值可能已过时。恢复网络连接后,总数将更新。

要解决隔离问题描述 ,您可以在与网格隔离的每个隔离节点或组中的一个节点(子网中不包含主管理节点的所有节点)上运行命令行实用程序。该实用程序可为节点提供网格中非隔离节点的 IP 地址,从而使隔离的节点或节点组能够再次访问整个网格。

备注 如果在网络中禁用了多播域名系统(mDNS)、则可能需要在每个隔离的节点上运行命令行实用程序。
步骤

只有部分服务脱机或报告通信错误时、此过程不适用。

  1. 访问节点并检查 `/var/local/log/dynip.log`隔离消息。

    例如:

    [2018-01-09T19:11:00.545] UpdateQueue - WARNING -- Possible isolation, no contact with other nodes.
    If this warning persists, manual action might be required.

    如果您使用的是 VMware 控制台,则它将包含一条消息,指出此节点可能已隔离。

    在Linux部署中、隔离消息会显示在文件中 /var/log/storagegrid/node/<nodename>.log

  2. 如果隔离消息重复出现且持久,请运行以下命令:

    add_node_ip.py <address>

    其中 `<address>`是连接到网格的远程节点的IP地址。

    # /usr/sbin/add_node_ip.py  10.224.4.210
    
    Retrieving local host information
    Validating remote node at address 10.224.4.210
    Sending node IP hint for 10.224.4.210 to local node
    Local node found on remote node. Update complete.
  3. 验证先前隔离的每个节点的以下情况:

    • 节点的服务已启动。

    • 运行命令后、动态IP服务的状态为"正在运行" storagegrid-status

    • 在节点页面上、节点不再显示为与网格的其余部分断开连接。

备注 如果运行 `add_node_ip.py`命令无法解决问题、则可能还需要解决其他网络问题。