简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

更换 PCIe 卡— AFF A320

要更换 PCIe 卡,您必须断开卡的缆线连接,从卡中卸下 SFP 和 QSFP 模块,然后再卸下提升板,重新安装提升板,最后重新安装 SFP 和 QSFP 模块,最后再为卡布线。

  • 您可以将此操作步骤与系统支持的所有 ONTAP 版本结合使用

  • 系统中的所有其他组件必须正常运行;否则,您必须联系技术支持。

第 1 步:关闭受损控制器

使用适用于您的配置的操作步骤 关闭或接管受损控制器。

选项 1 :大多数配置

要关闭受损控制器,您必须确定控制器的状态,并在必要时接管控制器,以便运行正常的控制器继续从受损控制器存储提供数据。

关于此任务
  • 如果您使用的是 NetApp 存储加密,则必须按照 _ONTAP 9 NetApp 加密高级指南 _ 的 "`将 SED 返回到未受保护的模式` " 一节中的说明重置 MSID 。

  • 如果您使用的是 SAN 系统,则必须已检查受损控制器 SCSI 刀片式服务器的事件消息(事件日志显示)。

    每个 SCSI 刀片式服务器进程应与集群中的其他节点保持仲裁关系。在继续更换之前,必须先解决所有问题。

  • If you have a cluster with more than two nodes, it must be in quorum.如果集群未达到仲裁或运行状况良好的控制器在资格和运行状况方面显示 false ,则必须在关闭受损控制器之前更正问题描述 ;请参见 "CLI 管理概述"

  • 如果您使用的是 MetroCluster 配置,则必须确认已配置 MetroCluster 配置状态,并且节点处于已启用且正常的状态(MetroCluster node show )。

步骤
  1. 如果启用了 AutoSupport ,则通过调用 AutoSupport 消息禁止自动创建案例: ssystem node AutoSupport invoke -node * -type all -message MAINT=number_of_hours_downh

    以下 AutoSupport 消息禁止自动创建案例两小时: cluster1 : * > system node AutoSupport invoke -node * -type all -message MAINT=2h

  2. 从运行正常的控制器的控制台禁用自动交还: storage failover modify – node local -auto-giveback false

  3. 将受损控制器显示为 LOADER 提示符:

    如果受损控制器显示 …​ 那么 …​

    LOADER 提示符

    转至 "Remove controller module" 。

    正在等待交还

    按 Ctrl-C ,然后在出现提示时回答 y

    系统提示符或密码提示符(输入系统密码)

    从运行正常的控制器接管或暂停受损的控制器: storage failover takeover -ofnode impaired_node_name

    当受损控制器显示 Waiting for giveback…​ 时,按 Ctrl-C ,然后回答 y

选项 2 :控制器位于 MetroCluster 中

注 如果您的系统采用双节点 MetroCluster 配置,请勿使用此操作步骤。

要关闭受损控制器,您必须确定控制器的状态,并在必要时接管控制器,以便运行正常的控制器继续从受损控制器存储提供数据。

  • If you have a cluster with more than two nodes, it must be in quorum.如果集群未达到仲裁或运行状况良好的控制器在资格和运行状况方面显示 false ,则必须在关闭受损控制器之前更正问题描述 ;请参见 "CLI 管理概述"

  • 如果您使用的是 MetroCluster 配置,则必须确认已配置 MetroCluster 配置状态,并且节点处于已启用且正常的状态(MetroCluster node show )。

步骤
  1. 如果启用了 AutoSupport ,则通过调用 AutoSupport 消息禁止自动创建案例: ssystem node AutoSupport invoke -node * -type all -message MAINT=number_of_hours_downh

    以下 AutoSupport 消息禁止自动创建案例两小时: cluster1 : * > system node AutoSupport invoke -node * -type all -message MAINT=2h

  2. 从运行正常的控制器的控制台禁用自动交还: storage failover modify – node local -auto-giveback false

  3. 将受损控制器显示为 LOADER 提示符:

    如果受损控制器显示 …​ 那么 …​

    LOADER 提示符

    转至 "Remove controller module" 。

    正在等待交还

    按 Ctrl-C ,然后在出现提示时回答 y

    系统提示符或密码提示符(输入系统密码)

    从运行正常的控制器接管或暂停受损的控制器: storage failover takeover -ofnode impaired_node_name

    当受损控制器显示 Waiting for giveback…​ 时,按 Ctrl-C ,然后回答 y

第 2 步:卸下控制器模块

要访问控制器模块内部的组件,必须从机箱中卸下控制器模块。

  1. 如果您尚未接地,请正确接地。

  2. 从电源拔下控制器模块电源。

  3. 松开将缆线绑在缆线管理设备上的钩环带,然后从控制器模块上拔下系统缆线和 SFP (如果需要),并跟踪缆线的连接位置。

    DRW A320 控制器缆线拔下动画 gif

    将缆线留在缆线管理设备中,以便在重新安装缆线管理设备时,缆线排列有序。

  4. 从控制器模块的左右两侧卸下缆线管理设备并将其放在一旁。

  5. 从机箱中卸下控制器模块:

    DRW A320 控制器删除动画 gif
    1. 将前掌插入控制器模块两侧的锁定装置。

    2. 向下按压闩锁装置顶部的橙色卡舌,直到其脱离机箱上的闩锁销。

      闩锁机制挂钩应接近垂直,并且应远离机箱销。

    3. 将控制器模块轻轻向您的方向拉几英寸,以便抓住控制器模块两侧。

    4. 用双手将控制器模块轻轻拉出机箱,并将其放在平稳的表面上。

第 3 步:更换 PCIe 卡

您必须从控制器模块中卸下包含故障 PCIe 卡的 PCIe 提升板,从提升板中卸下故障 PCIe 卡,在提升板中安装替代 PCIe 卡,然后将此提升板重新安装到控制器模块中。

DRW A320 PCI 卡更换动画 gif
  1. 拧下 PCIe 提升板上的蓝色翼形螺钉,将盖板滑向您的方向,向上旋转盖板,将其从控制器模块上取下,然后将其放在一旁。

  2. 卸下具有故障 PCIe 卡的提升板:

    1. 卸下 PCIe 卡中可能存在的所有 SFP 或 QSFP 模块。

    2. 将前掌放在竖板模块左侧的孔中,然后用拇指抓住竖板。

    3. 将竖板竖直提出插槽并放在一旁。

  3. 更换提升板中的卡:

    1. 将此竖板放在平稳的表面上,然后转动此竖板,以便可以访问 PCIe 卡。

    2. 拇指放在插槽两侧 PCIe 卡底边缘下方,然后轻轻向上推,将卡从插槽中释放。

    3. 将卡滑出竖板并放在一旁。

    4. 将更换用的卡挡板与提升板的边缘和卡的外边缘与提升板左侧的对齐导轨对齐。

    5. 轻轻滑动卡,直到卡连接器与提升板插槽对齐,然后将卡向下轻推入插槽。

  4. 在控制器模块中重新安装此提升板:

    1. 将提升板对齐到开口上,使提升板的前边缘直接位于提升板托架上的开口上方。

    2. 对齐提升板的后边缘,使提升板下侧的插脚位于后提升板托架的金属板上的孔上方。

    3. 均匀向下施加压力,将提升板竖直向下插入控制器模块上的插槽。

    4. 在控制器模块上重新安装 PCIe 提升板盖板。

9 月 4 日:安装控制器模块

更换控制器模块中的组件后,必须将控制器模块重新安装到机箱中,然后将其启动至维护模式。

  1. 如果尚未关闭控制器模块后部的通风管,请将盖板重新安装到 PCIe 卡上。

  2. 将控制器模块的末端与机箱中的开口对齐,然后将控制器模块轻轻推入系统的一半。

    DRW A320 控制器安装动画 gif
    注 请勿将控制器模块完全插入机箱中,除非系统指示您这样做。
  3. 仅为管理和控制台端口布线,以便您可以访问系统以执行以下各节中的任务。

    注 您将在此操作步骤中稍后将其余缆线连接到控制器模块。
  4. 完成控制器模块的重新安装:

    1. 确保闩锁臂锁定在扩展位置。

    2. 使用闩锁臂将控制器模块推入机箱托架,直到其停止。

    3. 按住锁定机制顶部的橙色卡舌。

    4. 将控制器模块轻轻推入机箱托架,直至其与机箱边缘平齐。

      注 锁定机制臂滑入机箱。

    控制器模块一旦完全固定在机箱中,就会开始启动。

    1. 释放闩锁,将控制器模块锁定到位。

    2. 已重新连接电源。

    3. 如果尚未重新安装缆线管理设备,请重新安装该设备。

    4. Ctrl-C 以中断正常启动过程。

Step 5: Restore the controller module to operation

完成诊断后,您必须重新对系统进行配置,交还控制器模块,然后重新启用自动交还。

  1. 根据需要重新对系统进行布线。

    如果您已卸下介质转换器( QSFP 或 SFP ),请记得在使用光缆时重新安装它们。

  2. 交还控制器的存储,使其恢复正常运行: storage failover giveback -ofnode impaired_node_name

  3. 如果已禁用自动交还,请重新启用它: storage failover modify -node local -auto-giveback true

第 6 步:将故障部件退回 NetApp

按照套件随附的 RMA 说明将故障部件退回 NetApp 。请参见 "部件退回和放大器;更换" 第页,了解更多信息。