确定对象是否永久不可用

您可以通过使用 TSM 管理控制台发出请求来确定对象是否永久不可用。

开始之前

关于本任务

此示例仅供您参考;此操作步骤无法帮助您确定可能导致对象或磁带卷不可用的所有故障情况。有关 TSM 管理的信息,请参见 TSM 服务器文档。

过程

  1. 登录到管理节点:
    1. 输入以下命令: SSH admin@Admin_Node_IP
    2. 输入 Passwords.txt 文件中列出的密码。
  2. 确定归档节点无法检索到的一个或多个对象:
    1. 转到包含审核日志文件的目录: cd /var/local/audit/export
      活动的审核日志文件名为 audit.log。每天保存一次活动 audit.log 文件, audit.log 并启动一个新文件。已保存文件的名称以 yyyy-mm-dd.txt格式指示保存时间。一天之后,保存的文件将以格式进行压缩和重命名 yyyy-mm-dd.txt.gz,从而保留原始日期。
    2. 在相关审核日志文件中搜索指示无法检索归档对象的消息。例如,输入: grep ARCE audit.log | less -n
      如果无法从归档节点检索对象,则 Arce 审核消息(归档对象检索结束)会在结果字段中显示 Arun (归档中间件不可用)或 GERR (一般错误)。审核日志中的以下示例行显示,对于 CBID 498D8A1F681F05B3 , Arce 消息已终止,结果为 Arun 。
      [AUDT:[CBID(UI64):0x498D8A1F681F05B3][VLID(UI64):20091127][RSLT(FC32):ARUN][AVER(UI32):7]
      [ATIM(UI64):1350613602969243][ATYP(FC32):ARCE][ANID(UI32):13959984][AMID(FC32):ARCI]
      [ATID(UI64):4560349751312520631]]

      有关详细信息,请参见了解审核消息的说明。

    3. 记录请求失败的每个对象的 CBID 。
      您可能还需要记录 TSM 用于标识归档节点保存的对象的以下追加信息:
      • 文件空间名称:等效于归档节点 ID 。要查找归档节点 ID , 选择 Support。 然后,在菜单的工具部分中,选择 Grid Topology请。然后选择 Archive Node > ARC > Target > Overview
      • 高级别名称:相当于归档节点分配给对象的卷 ID 。卷 ID 采用日期( 2009 年 1127 )的形式,并在归档审核消息中记录为对象的 VLID 。
      • 低级名称:相当于 StorageGRID 系统分配给对象的 CBID 。
    4. 从命令 Shell 中注销: exit
  3. 检查 TSM 服务器,查看步骤 2 中标识的对象是否永久不可用:
    1. 登录到 TSM 服务器的管理控制台: dsmadmc
      请使用为该应用程序中心服务配置的管理用户名和密码。在 网格管理器中输入用户名和密码。(要查看用户名, 选择 Support。 然后,在菜单的工具部分中,选择 Grid Topology请参见。然后选择 Archive Node > ARC > Target > Configuration。)
    2. 确定对象是否永久不可用。
      例如,您可以在 TSM 活动日志中搜索该对象的数据完整性错误。以下示例显示了在过去一天的活动日志中搜索 CBID 为 498D8A1F681F05B3 的对象。
      > query actlog begindate=-1 search=276C14E94082CC69
      12/21/2008 05:39:15 ANR0548W Retrieve or restore 
      failed for session 9139359 for node DEV-ARC-20 (Bycast ARC) 
      processing file space /19130020 4 for file /20081002/ 
      498D8A1F681F05B3 stored as Archive - data 
      integrity error detected. (SESSION: 9139359)
      >

      请注意,根据错误的性质, CBID 可能不会记录在 TSM 活动日志中。您可能需要在日志中搜索请求失败前后的其他 TSM 错误。

    3. 如果整个磁带永久不可用,请确定存储在该卷上的所有对象的 CBID : query content TSM_Volume_Name
      其中 TSM_Volume_Name 是不可用磁带的 TSM 名称。以下是此命令的输出示例:
       > query content TSM-Volume-Name
      Node Name       Type Filespace  FSID Client's Name for File Name
      --------------- ---- ---------- ---- ----------------------------
      DEV-ARC-20      Arch /19130020  216  /20081201/ C1D172940E6C7E12
      DEV-ARC-20      Arch /19130020  216  /20081201/ F1D7FBC2B4B0779E

      文件名的客户端名称 与归档节点卷 ID (或 TSM 高级别名称)相同,后跟对象的 CBID (或 TSM 低级名称)。也就是说 ,文件名的客户端名称 格式为 //Archive Node volume IDCBID。在示例输出的第一行中 ,文件名的客户端名称/20081201/C1D172940E6C7E12

      另请注意 ,文件空间 是归档节点的节点 ID 。

      要取消检索请求,您需要卷上存储的每个对象的 CBID 以及归档节点的节点 ID 。

  4. 对于永久不可用的每个对象,请取消检索请求并执行问题描述 a 命令,以通知 StorageGRID 系统对象副本已丢失:
    注意: 请谨慎使用 ADE 控制台。如果控制台使用不当,则可能会中断系统操作并损坏数据。请认真输入命令,并且只能使用此操作步骤中记录的命令。
    1. 如果尚未登录到归档节点,请按以下方式登录:
      1. 输入以下命令: SSH admin@grid_node_IP
      2. 输入 Passwords.txt 文件中列出的密码。
      3. 输入以下命令切换到 root : su -
      4. 输入 Passwords.txt 文件中列出的密码。
    2. 访问 ARE 服务的 ADE 控制台: telnet localhost 1409
    3. 取消对象的请求: /proc/BRTR/cancel -c CBID

      其中 CBID 是无法从 TSM 检索的对象的标识符。

      如果该对象的唯一副本位于磁带上, 则批量检索 请求将被取消,并显示消息 1 Requests cancelled。如果对象的副本位于系统中的其他位置,则对象检索将由其他模块处理,因此对消息的响应为 0 Requests cancelled

    4. 问题描述一个命令,用于通知 StorageGRID 系统某个对象副本已丢失,并且必须另外创建一个副本: /proc/CMSI/Object_Lost CBID node_ID

      其中 CBID 是无法从 TSM 服务器检索的对象的标识符, node_ID 是检索失败的归档节点的节点 ID 。

      您必须为每个丢失的对象副本输入一个单独的命令:不支持输入 CBID 范围。

      在大多数情况 StorageGRID 下, StorageGRID 系统会立即开始为对象数据创建更多副本,以确保系统的 ILM 策略得到遵守。

      但是,如果对象的 ILM 规则指定只创建一个副本,而该副本现已丢失,则无法恢复该对象。在这种情况 StorageGRID 下,运行 object_lost 命令可从 StorageGRID 系统清除丢失对象的元数据。

      当 Object_Lost 命令成功完成后,将返回以下消息:
      Cloc_lost_ans 返回的结果为 ‘SUCS '
      注: /proc/CMSI/Object_Lost 命令仅适用于归档节点上存储的丢失对象。
    5. 退出 ADE 控制台: exit
    6. 从归档节点中注销: exit
  5. 重置 StorageGRID 系统中的请求失败值:
    1. 转至 Archive Node > ARC > Retrieve > Configuration,然后选择 Reset Request Failure Count
    2. 单击 Apply Changes