Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

在ONTAP还原后验证集群和存储运行状况

贡献者

还原ONTAP集群后、您应验证节点是否运行状况良好、是否有资格加入集群、以及集群是否处于仲裁状态。您还应验证磁盘,聚合和卷的状态。

验证集群运行状况

步骤
  1. 验证集群中的节点是否已联机且符合加入集群的条件:

    cluster show

    在此示例中、集群运行状况良好、所有节点均有资格加入集群。

    cluster1::> cluster show
    Node                  Health  Eligibility
    --------------------- ------- ------------
    node0                 true    true
    node1                 true    true

    如果任何节点运行状况不正常或不符合条件,请检查 EMS 日志中的错误并采取更正措施。

  2. 将权限级别设置为高级:

    set -privilege advanced

    输入 …​ y 以继续。

  3. 验证每个 RDB 进程的配置详细信息。

    • 每个节点的关系数据库 epoch 和数据库 epochs 应匹配。

    • 所有节点的每环仲裁主机都应相同。

      请注意,每个环可能具有不同的仲裁主环。

      要显示此 RDB 进程 …​ 输入此命令 …​

      管理应用程序

      cluster ring show -unitname mgmt

      卷位置数据库

      cluster ring show -unitname vldb

      虚拟接口管理器

      cluster ring show -unitname vifmgr

      SAN 管理守护进程

      cluster ring show -unitname bcomd

      此示例显示了卷位置数据库过程:

    cluster1::*> cluster ring show -unitname vldb
    Node      UnitName Epoch    DB Epoch DB Trnxs Master    Online
    --------- -------- -------- -------- -------- --------- ---------
    node0     vldb     154      154      14847    node0     master
    node1     vldb     154      154      14847    node0     secondary
    node2     vldb     154      154      14847    node0     secondary
    node3     vldb     154      154      14847    node0     secondary
    4 entries were displayed.
  4. 返回到管理权限级别:

    set -privilege admin
  5. 如果您在 SAN 环境中运行,请验证每个节点是否处于 SAN 仲裁状态:

    event log show  -severity informational -message-name scsiblade.*

    每个节点的最新 scsiblade 事件消息应指示 SCSI 刀片处于仲裁状态。

    cluster1::*> event log show  -severity informational -message-name scsiblade.*
    Time             Node       Severity       Event
    ---------------  ---------- -------------- ---------------------------
    MM/DD/YYYY TIME  node0      INFORMATIONAL  scsiblade.in.quorum: The scsi-blade ...
    MM/DD/YYYY TIME  node1      INFORMATIONAL  scsiblade.in.quorum: The scsi-blade ...
相关信息

"系统管理"

验证存储运行状况

还原或降级集群后,您应验证磁盘,聚合和卷的状态。

步骤
  1. 验证磁盘状态:

    要检查 …​ 执行此操作 …​

    磁盘已损坏

    1. 显示任何损坏的磁盘:

      storage disk show -state broken
    2. 卸下或更换任何损坏的磁盘。

    正在进行维护或重建的磁盘

    1. 显示处于维护,待定或重建状态的任何磁盘:

      storage disk show -state maintenance

    pending

    reconstructing ---- .. 等待维护或重建操作完成,然后再继续。

  2. 通过显示物理和逻辑存储(包括存储聚合)的状态,验证所有聚合是否联机:

    storage aggregate show -state !online

    此命令将显示 not 联机的聚合。在执行重大升级或还原之前和之后,所有聚合都必须处于联机状态。

    cluster1::> storage aggregate show -state !online
    There are no entries matching your query.
  3. 通过显示任何 not 联机的卷来验证所有卷是否均已联机:

    volume show -state !online

    在执行重大升级或还原之前和之后,所有卷都必须处于联机状态。

    cluster1::> volume show -state !online
    There are no entries matching your query.
  4. 验证是否没有不一致的卷:

    volume show -is-inconsistent true

    请参见知识库文章 "卷显示WAFL 不一致" 有关如何处理不一致的卷的信息。

验证客户端访问(SMB和NFS)

对于已配置的协议,测试 SMB 和 NFS 客户端的访问,以验证集群是否可访问。