Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

更换I/O模块- AFF A70、AFF A90

贡献者

使用此过程更换发生故障的I/O模块。

  • 您可以对存储系统支持的所有ONTAP版本使用此过程。

  • 存储系统中的所有其他组件必须正常运行;否则,您必须联系技术支持。

第 1 步:关闭受损控制器

使用以下选项之一关闭或接管受损控制器。

选项 1 :大多数系统

要关闭受损控制器,您必须确定控制器的状态,并在必要时接管控制器,以便运行正常的控制器继续从受损控制器存储提供数据。

关于此任务
  • 如果您使用的是SAN系统,则必须已检查受损控制器SCSI刀片的事件消息 cluster kernel-service show。 `cluster kernel-service show`命令(在priv高级模式下)可显示节点名称、该节点的仲裁状态、该节点的可用性状态以及该节点的运行状态。

    每个 SCSI 刀片式服务器进程应与集群中的其他节点保持仲裁关系。在继续更换之前,必须先解决所有问题。

  • If you have a cluster with more than two nodes, it must be in quorum.如果集群未达到仲裁或运行状况良好的控制器在资格和运行状况方面显示false、则必须在关闭受损控制器之前更正问题描述 ;请参见 "将节点与集群同步"

步骤
  1. 如果启用了AutoSupport、则通过调用AutoSupport消息禁止自动创建案例: system node autosupport invoke -node * -type all -message MAINT=<# of hours>h

    以下AutoSupport 消息禁止自动创建案例两小时: cluster1:> system node autosupport invoke -node * -type all -message MAINT=2h

  2. 从运行正常的控制器的控制台禁用自动交还: storage failover modify – node local -auto-giveback false

    备注 当您看到_Do you want to disable auto-giveback?_时、输入`y`。
  3. 将受损控制器显示为 LOADER 提示符:

    如果受损控制器显示 …​ 那么 …​

    LOADER 提示符

    转至下一步。

    正在等待交还

    按 Ctrl-C ,然后在出现提示时回答 y

    系统提示符或密码提示符

    从运行正常的控制器接管或暂停受损的控制器: storage failover takeover -ofnode impaired_node_name

    当受损控制器显示 Waiting for giveback…​ 时,按 Ctrl-C ,然后回答 y

选项 2 :控制器位于 MetroCluster 中

要关闭受损控制器,您必须确定控制器的状态,并在必要时接管控制器,以便运行正常的控制器继续从受损控制器存储提供数据。

  • If you have a cluster with more than two nodes, it must be in quorum.如果集群未达到仲裁或运行状况良好的控制器在资格和运行状况方面显示false、则必须在关闭受损控制器之前更正问题描述 ;请参见 "将节点与集群同步"

  • 如果您使用的是 MetroCluster 配置,则必须确认已配置 MetroCluster 配置状态,并且节点处于已启用且正常的状态(MetroCluster node show )。

步骤
  1. 如果启用了 AutoSupport ,则通过调用 AutoSupport 消息禁止自动创建案例: ssystem node AutoSupport invoke -node * -type all -message MAINT=number_of_hours_downh

    以下 AutoSupport 消息禁止自动创建案例两小时: cluster1 : * > system node AutoSupport invoke -node * -type all -message MAINT=2h

  2. 从运行正常的控制器的控制台禁用自动交还: storage failover modify – node local -auto-giveback false

  3. 将受损控制器显示为 LOADER 提示符:

    如果受损控制器显示 …​ 那么 …​

    LOADER 提示符

    转至下一步。

    正在等待交还

    按 Ctrl-C ,然后在出现提示时回答 y

    系统提示符或密码提示符(输入系统密码)

    从运行正常的控制器接管或暂停受损的控制器: storage failover takeover -ofnode impaired_node_name

    当受损控制器显示 Waiting for giveback…​ 时,按 Ctrl-C ,然后回答 y

第2步:更换发生故障的I/O模块

要更换I/O模块、请在控制器模块中找到该模块、然后按照特定的步骤顺序进行操作。

  1. 在机箱正面、用拇指用力推入每个驱动器、直到您感觉到有一定的停机。这样可确保驱动器牢固地固定在机箱中板上。

    DRW a800驱动器已就位IEOPS960
  2. 转至机箱背面。如果您尚未接地,请正确接地。

  3. 通过将控制器模块拉出大约三英寸来断开电源:

    备注 如果存储系统具有直流电源设备(PSU)、请断开电源电缆块与PSU的连接。
    1. 向下按两个锁定闩锁,然后同时向下旋转两个闩锁。

    2. 将控制器模块从机箱中拉出约3英寸以断开电源。

  4. 拔下目标 I/O 模块上的所有布线。

    请确保为这些缆线贴上标签,以便您知道这些缆线来自何处。

  5. 向下旋转缆线管理托架、方法是拉动缆线管理托架内部的按钮、然后向下旋转。

  6. 从控制器模块中卸下I/O模块:

    备注 下图显示了如何卸下水平和垂直I/O模块。通常、您只会卸下一个I/O模块。
    卸下I/O模块

    标注编号1、Wides=30bex

    凸轮锁定按钮

    1. 按下凸轮闩锁按钮。

      凸轮闩锁移离控制器模块。

    2. 将凸轮闩锁向下旋转到最远位置。对于水平模块、将凸轮尽可能远离模块。

    3. 将手指插入凸轮拉杆开口处、然后将模块拉出控制器模块、从而将模块从控制器模块中卸下。

      确保跟踪 I/O 模块所在的插槽。

  7. 将 I/O 模块放在一旁。

  8. 将更换用的I/O模块安装到目标插槽中:

    1. 将 I/O 模块与插槽边缘对齐。

    2. 将模块轻轻地滑入插槽、直至完全滑入控制器模块、然后将凸轮闩锁一直向上旋转、以将模块锁定到位。

  9. 为I/O模块布线。

  10. 重复拆卸和安装步骤以更换控制器的其他模块。

  11. 将控制器模块重新安装到机箱中。

    备注 如果您有直流电源、请将电缆块重新连接到PSU。
  12. 将缆线管理托架旋转到锁定位置。

第3步:重新启动控制器

更换 I/O 模块后,必须重新启动控制器模块。

备注 如果新I/O模块与故障模块型号不同、则必须先重新启动BMC。
步骤
  1. 如果替代模块与旧模块的型号不同、请重新启动BMC:

    1. 从加载程序提示符处、更改为高级权限模式:set PRILEGE advanced

    2. 重新启动BMC:_sp reboot

  2. 在 LOADER 提示符处,重新启动节点: _bybye

    备注 此操作将重新初始化I/O卡和其他组件、然后重新启动节点。
    备注 请务必在完成转换后退出维护模式。
  3. 将节点恢复正常运行:storage故障转移g交还-ofnode受损_ne_name

  4. 如果已禁用自动交还、请重新启用它:_storage故障转移修改-node local -auto-交还true _

第 4 步:将故障部件退回 NetApp

按照套件随附的 RMA 说明将故障部件退回 NetApp 。请参见 "部件退回和放大器;更换" 第页,了解更多信息。