简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

对 SnapManager 进行故障排除

提供者 下载此页面的 PDF

您可以找到有关可能发生的一些最常见问题以及如何解决这些问题的信息。

下表介绍了常见问题和可能的解决方案:

问题驱动型问题 可能的解决方案

目标数据库和侦听器是否正在运行?

运行 lsnrctl status 命令。确保已将数据库实例注册到侦听器中。

存储是否可见?

运行 SnapDrive storage show -all 命令。

存储是否可写?

编辑刚刚创建的挂载点中的文件。使用 touch filename 命令。如果创建了该文件,则您的存储是可写的。您必须确保 SnapManager 运行时所使用的用户(例如 UNIX 上以 root 用户身份)可以写入存储。

SnapManager 服务器是否正在运行?

运行 smo_server status 并尝试使用 smo_server start 命令启动服务器。

在使用图形用户界面( GUI )或命令行界面( CLI )启动与配置文件相关的 SnapManager 命令之前,服务器必须正在运行。您可以在不启动服务器的情况下创建或更新存储库,但要执行所有其他 SnapManager 操作,服务器必须正在运行。

要启动 SnapManager 服务器,请输入以下命令: smo_server start 。

是否已正确设置运行 SnapManager 所需的所有组件?

运行 smo system verify 命令以验证是否已正确设置 SnapDrive 。

您的 SnapManager 版本是否正确?

使用 smo version 命令检查 SnapManager 版本。

您是否查看过 SnapManager 日志文件以确定错误消息是否有助于隔离问题描述?

SnapManager 会将所有日志条目记录到一组轮换日志文件中。日志文件位于 /var/log/SMO 。

日志文件位于 C : \program_files\NetApp\SnapManager for Oracle\logs 。

在以下位置查看日志可能也会很有帮助:

/usr/home/.NetApp/SMO/3.3.0/log/

每个操作日志都会写入其自己的日志文件中,格式为 smo__of_date_time.log 。

如果归档日志存储在未运行 Data ONTAP 的存储系统上,是否已将其排除在使用 SnapManager 进行备份的考虑范围之外?

使用 SMO.config 文件可以排除某些归档日志文件。对于 UNIX ,这些文件位于以下位置: /opt/netapp/smO/properties/smo.config

使用文件中所述的格式排除本地归档日志。对于追加信息,请 S" 设置配置属性 " 主题。

您还可以在使用 SnapManager 命令行界面创建备份时排除归档日志目标。对于追加信息,请参见 "`创建数据库备份` " 主题。

您还可以在使用 SnapManager 图形用户界面创建备份时排除归档日志目标。

如果将 SnapManager 与 NFS 数据库结合使用,是否具有 FlexClone 许可证?

要在 NFS 数据库中充分利用 SnapManager ,需要 FlexClone 许可证。SnapManager 使用 FlexClone 功能完成以下任务:

  • 挂载 NFS 数据库的备份

  • 验证 NFS 数据库的备份

  • 克隆 NFS 数据库

  • 向 RMAN 注册 NFS 数据库的备份(如果使用 RMAN )

是否无法连接到存储库?

如果连接到存储库失败,请对存储库数据库运行 lsnrctl status 命令并检查活动服务名称。当 SnapManager 连接到存储库数据库时,它会使用数据库的服务名称。根据侦听器的设置方式,此名称可能是短服务名称或完全限定服务名称。当 SnapManager 连接到数据库进行备份,还原或其他操作时,它会使用主机名和 SID 。如果存储库由于当前无法访问而未正确初始化,您将收到一条错误消息,询问是否要删除该存储库。您可以从当前视图中删除存储库,以便可以对其他存储库执行操作。

此外,运行 ps -eaf 检查存储库实例是否正在运行

grepinstance — name 命令。

系统是否可以解析主机名?

检查指定的主机名是否位于其他子网上。如果您收到一条错误消息,指出 SnapManager 无法解析主机名,请在主机文件中添加主机名。将主机名添加到位于 /etc/hosts 的文件中: xxx.xxx.xxx.xxx 主机名 IP 地址

SnapDrive 是否正在运行?

检查 SnapDrive 守护进程是否正在运行: -snapdrived status

如果守护进程未运行,则会显示一条消息,指出存在连接错误。

哪些存储系统配置为可使用 SnapDrive 进行访问?

运行命令: -sun SnapDrive config list

如何提高 SnapManager 图形用户界面的性能?

  • 确保您具有存储库,配置文件主机和配置文件的有效用户凭据。

    如果凭据无效,请清除存储库,配置文件主机和配置文件的用户凭据。重置先前为存储库,配置文件主机和配置文件设置的相同用户凭据。有关追加信息重新设置用户凭据的信息,请参见 S" 清除凭据缓存后设置凭据 " 。

  • 关闭未使用的配置文件。

    如果打开的配置文件数量更多,则 SnapManager 图形用户界面性能会降低。

  • 检查是否在 SnapManager 图形用户界面的 * 管理 * 菜单下的用户首选项窗口中启用了 * 启动时打开 * 。

    如果启用了此选项,则 /root/.NetApp/SMO/3.3.3/GUI/state 中提供的用户配置( user.config )文件将显示为 openOnStartup=profile 。

    由于已启用 * 启动时打开 * ,因此您必须在用户配置( user.config )文件中使用 lastOpenProfile 检查 SnapManager 图形用户界面中最近打开的配置文件: lastOpenProfiles=Profile1 , PROFILE2 , PROFILE3 , …​

    您可以删除列出的配置文件名称,并且始终保持最小数量的配置文件处于打开状态。

  • 与未受保护的配置文件相比,受保护的配置文件刷新所需时间更长。

    受保护的配置文件将根据用户配置( user.config )文件的 protectionStatusRefreshRate 参数中指定的值以一定时间间隔刷新。

    您可以将此值从默认值( 300 秒)增加,以便仅在指定时间间隔后刷新受保护的配置文件。

  • 在基于 UNIX 的环境上安装新版本的 SnapManager 之前,请删除以下位置提供的 SnapManager 客户端条目:

    /root/.netapp

如果在后台同时启动和运行多个 SnapManager 操作,则 SnapManager 图形用户界面需要较长时间才能刷新。右键单击备份(该备份已删除,但仍显示在 SnapManager 图形用户界面中)时,备份或克隆窗口中不会启用该备份的备份选项。

您需要等待 SnapManager 图形用户界面刷新,然后检查备份状态。

如果 Oracle 数据库未设置为英语,您会怎么做?

如果 Oracle 数据库的语言未设置为英语,则 SnapManager 操作可能会失败。将 Oracle 数据库的语言设置为英语:

  1. 在 /etc/init.d/smo_server 的初始注释下添加以下内容

    • NLS_LANG_= 美洲

    • 导出 NLS_LANG

  2. 使用以下命令重新启动 SnapManager 服务器: smo_server restart

注 如果 Oracle 用户的登录脚本(例如 .bash_profile , .bashrc 和 .cshrc )设置为 NLS_LANG ,则必须编辑此脚本,以使其不会覆盖 NLS_LANG 。

如果存储库数据库指向多个 IP 且每个 IP 都有不同的主机名,则在备份计划操作失败时,您会怎么做?

  1. 停止 SnapManager 服务器。

  2. 从要触发备份计划的主机中删除存储库目录中的计划文件。

    计划文件名可以采用以下格式:

    • repository_repo_username#repository_database_name#repository_host#repo_port

    • repository-repo_usernameerepository_database_name-repository_host-repo_port * 注意: * 您必须确保以与存储库详细信息匹配的格式删除计划文件。

  3. 重新启动 SnapManager 服务器。

  4. 从 SnapManager 图形用户界面打开同一存储库下的其他配置文件,以确保不会遗漏这些配置文件的任何计划信息。

如果 SnapManager 操作失败并出现凭据文件锁定错误,您会怎么做?

SnapManager 会在更新前锁定凭据文件,并在更新后将其解锁。如果同时运行多个操作,其中一个操作可能会锁定凭据文件以进行更新。如果另一个操作同时尝试访问锁定的凭据文件,则操作将失败并显示文件锁定错误。

根据同时运行的频率,在 SMO.config 文件中配置以下参数:

  • fileLock.retryInterval = 100 毫秒

  • fileLock.timeout = 5000 毫秒

注 分配给参数的值必须以毫秒为单位。

如果备份验证操作的中间状态在 " 监控 " 选项卡中显示失败,即使备份验证操作仍在运行,您会怎么做?

此错误消息会记录在 sm_gui.log 文件中。您必须在日志文件中查看以确定 operation.s检测 信号间隔和 operation.s检测 信号阈值参数的新值,这些参数将解决此问题描述。

  1. 在 SMO.config 文件中添加以下参数:

    • operation.s检测 信号间隔 = 5000

    • operation.s检测 信号阈值 = 5000 SnapManager 分配的默认值为 5000 。

  2. 为这些参数分配新值。

    注 分配给参数的值必须以毫秒为单位。
  3. 重新启动 SnapManager 服务器并重新执行此操作。

遇到堆空间问题描述时应如何操作?

在 SnapManager for Oracle 操作期间遇到堆空间问题描述时,必须执行以下步骤:

  1. 导航到 SnapManager for Oracle 安装目录。

  2. 从 installationdirectory/bin/sunchjava 路径打开此启动 java 文件。

  3. 增加 java -Xmx160m java heave-space 参数的值。

    例如,您可以将默认值 160 米增加到 200 米。

    注 如果在早期版本的 SnapManager for Oracle 中增加了 Java heave-space 参数的值,则应保留该值。

如果无法使用受保护的备份还原或克隆,您会怎么做?

如果您将 SnapManager 3.3.1 与集群模式 Data ONTAP 结合使用并升级到 SnapManager 3.4 ,则会发现此问题描述。在 SnapManager 3.3.1 中,备份会使用后脚本进行保护。从 SnapManager 3.4 开始,备份将使用创建配置文件时选择的 SnapManager_cDOT_Mirror 或 _SnapManager_cDOT_Vault_policies 进行保护。升级到 SnapManager 3.4 后,您可能仍在使用旧配置文件,因此备份将使用备份脚本进行保护。 但是,您不能使用它们通过 SnapManager 进行还原或克隆。

您必须更新配置文件并选择 SnapManager_cDOT_Mirror 或 _SnapManager_cDOT_Vault_policy ,然后删除 SnapManager 3.3.1 中用于数据保护的后处理脚本。

如果计划的备份不受保护( SnapVault ),您会怎么做?