NVFAIL 如何影响对 NFS 卷或 LUN 的访问

在以下情况下,系统将设置 NVFAIL 状态:ONTAP 在启动时检测到 NVRAM 错误、发生 MetroCluster 切换操作或在卷上设置了 NVFAIL 选项的情况下执行 HA 接管操作。如果启动时没有检测到错误,则会正常启动文件服务。但是,如果检测到 NVRAM 错误或在进行灾难切换时执行 NVFAIL 处理,则 ONTAP 会使数据库实例无法响应。

如果启用了 NVFAIL 选项,则会在启动期间发生下表所述过程之一:

条件 操作
ONTAP 未检测到 NVRAM 错误 文件服务正常启动。
ONTAP 检测到 NVRAM 错误
  • ONTAP 向尝试访问数据库的 NFS 客户端返回文件句柄已过时 (ESTALE) 的错误,从而使应用程序无法响应,或者导致崩溃或关闭。

    之后,ONTAP 将向系统控制台和日志文件发送一条错误消息。

  • 在应用程序重新启动后,CIFS 客户端即可访问文件(即使尚未验证文件是否有效)。

    对于 NFS 客户端,在受影响的卷上重置 in-nvfailed-state 选项之前,文件将仍不可访问。

如果使用了以下参数之一:

  • 设置了 dr-force-nvfail 卷选项
  • 设置了 force-nvfail-all 切换命令选项。
如果管理员不希望在将来可能发生灾难切换操作时执行 NVFAIL 处理,您可以在执行切换后取消设置 dr-force-nvfail 选项。

对于 NFS 客户端,在受影响的卷上重置 in-nvfailed-state 选项之前,文件将仍不可访问。

注:使用 force-nvfail-all 选项将在灾难切换期间处理的所有灾难恢复卷上设置 dr-force-nvfail 选项。
ONTAP 在包含 LUN 的卷上检测到 NVRAM 错误 该卷中的 LUN 会被脱机。必须清除该卷上的 in-nvfailed-state 选项,并通过使受影响卷上的每个 LUN 联机来清除这些 LUN 上的 NVFAIL 属性。

您可以执行相应的步骤来检查 LUN 的完整性,并根据需要从 Snapshot 副本或备份中恢复 LUN。恢复卷中的所有 LUN 之后,受影响卷上的 in-nvfailed-state 选项即被清除。