Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

搜索并还原可能丢失的对象

贡献者

可能会找到并还原已触发 " 对象丢失(丢失) " 警报和 " 对象丢失 * " 警报且您已确定可能丢失的对象。

开始之前
关于此任务

您可以按照此操作步骤 在网格中其他位置查找丢失对象的复制副本。在大多数情况下,找不到丢失的对象。但是,在某些情况下,如果您立即采取措施,则可能能够找到并还原丢失的复制对象。

重要说明 请联系技术支持以获得有关此操作步骤 的帮助。
步骤
  1. 在管理节点中,搜索审核日志以查找可能的对象位置:

    1. 登录到网格节点:

      1. 输入以下命令: ssh admin@grid_node_IP

      2. 输入中列出的密码 Passwords.txt 文件

      3. 输入以下命令切换到root: su -

      4. 输入中列出的密码 Passwords.txt 文件以root用户身份登录后、提示符将从变为 $ to #

    2. 更改为审核日志所在的目录: cd /var/local/audit/export/

    3. 使用grep提取 "与可能丢失的对象关联的审核消息" 并将其发送到输出文件。输入 …​ grep uuid-valueaudit_file_name > output_file_name

      例如:

      Admin: # grep 926026C4-00A4-449B-AC72-BCCA72DD1311 audit.log > messages_about_lost_object.txt
    4. 使用 grep 从此输出文件中提取丢失位置( LLLST )审核消息。输入 …​ grep LLST output_file_name

      例如:

      Admin: # grep LLST messages_about_lost_objects.txt

      LLST 审核消息类似于此示例消息。

      [AUDT:\[NOID\(UI32\):12448208\][CBIL(UI64):0x38186FE53E3C49A5]
      [UUID(CSTR):"926026C4-00A4-449B-AC72-BCCA72DD1311"][LTYP(FC32):CLDI]
      [PCLD\(CSTR\):"/var/local/rangedb/1/p/17/11/00rH0%DkRs&LgA%\#3tN6"\]
      [TSRC(FC32):SYST][RSLT(FC32):NONE][AVER(UI32):10][ATIM(UI64):
      1581535134379225][ATYP(FC32):LLST][ANID(UI32):12448208][AMID(FC32):CLSM]
      [ATID(UI64):7086871083190743409]]
    5. 在 LLST 消息中找到 PCLD 字段和 NOID 字段。

      如果存在,则 PCLD 的值为磁盘上缺少复制对象副本的完整路径。NOID 的值是可能找到对象副本的 LDR 的节点 ID 。

    如果找到对象位置,您可能能够还原该对象。

    1. 找到与此LDR节点ID关联的存储节点。在网格管理器中,选择 * 支持 * > * 工具 * > * 网格拓扑 * 。然后选择 * 。 Data Center_* > * 。 Storage Node_* > * 。

      LDR服务的节点ID位于节点信息表中。查看每个存储节点的信息,直到找到托管此 LDR 的存储节点为止。

  2. 确定对象是否位于审核消息中指示的存储节点上:

    1. 登录到网格节点:

      1. 输入以下命令: ssh admin@grid_node_IP

      2. 输入中列出的密码 Passwords.txt 文件

      3. 输入以下命令切换到root: su -

      4. 输入中列出的密码 Passwords.txt 文件

        以root用户身份登录后、提示符将从变为 $ to #

    2. 确定对象的文件路径是否存在。

      对于对象的文件路径,请使用 LLST 审核消息中的 PCLD 值。

      例如,输入:

      ls '/var/local/rangedb/1/p/17/11/00rH0%DkRs&LgA%#3tN6'
      备注 在命令中、始终将对象文件路径用单引号引起来以转义任何特殊字符。
      • 如果未找到对象路径、则对象将丢失、无法使用此操作步骤 还原。请联系技术支持。

      • 如果找到对象路径、请继续执行下一步。您可以尝试将找到的对象还原回 StorageGRID 。

  3. 如果找到对象路径、请尝试将此对象还原到StorageGRID :

    1. 从同一个存储节点中,更改对象文件的所有权,以便可通过 StorageGRID 进行管理。输入 …​ chown ldr-user:bycast 'file_path_of_object'

    2. Telnet 到 localhost 1402 以访问 LDR 控制台。输入 …​ telnet 0 1402

    3. 输入 …​ cd /proc/STOR

    4. 输入 …​ Object_Found 'file_path_of_object'

      例如,输入:

      Object_Found '/var/local/rangedb/1/p/17/11/00rH0%DkRs&LgA%#3tN6'

      发出 Object\_Found 命令将向网格通知对象的位置。它还会触发活动的 ILM 策略,该策略会根据策略中的指定创建其他副本。

      备注 如果找到对象的存储节点处于脱机状态、您可以将对象复制到任何处于联机状态的存储节点。将对象放置在联机存储节点的任何 /var/local/rangedb 目录中。然后、问题描述 Object\_Found 命令。
      • 如果无法还原对象、则 Object\_Found 命令失败。请联系技术支持。

      • 如果对象已成功还原到 StorageGRID ,则会显示一条成功消息。例如:

        ade 12448208: /proc/STOR > Object_Found '/var/local/rangedb/1/p/17/11/00rH0%DkRs&LgA%#3tN6'
        
        ade 12448208: /proc/STOR > Object found succeeded.
        First packet of file was valid. Extracted key: 38186FE53E3C49A5
        Renamed '/var/local/rangedb/1/p/17/11/00rH0%DkRs&LgA%#3tN6' to '/var/local/rangedb/1/p/17/11/00rH0%DkRt78Ila#3udu'

        继续下一步。

  4. 如果对象已成功还原到StorageGRID 、请验证是否已创建新位置。

    1. 输入 …​ cd /proc/OBRP

    2. 输入 …​ ObjectByUUID UUID_value

      以下示例显示 UUID 为 926026C4-00A4-449B-AC72-BCCA72DD1311 的对象有两个位置。

    ade 12448208: /proc/OBRP > ObjectByUUID 926026C4-00A4-449B-AC72-BCCA72DD1311
    
    {
        "TYPE(Object Type)": "Data object",
        "CHND(Content handle)": "926026C4-00A4-449B-AC72-BCCA72DD1311",
        "NAME": "cats",
        "CBID": "0x38186FE53E3C49A5",
        "PHND(Parent handle, UUID)": "221CABD0-4D9D-11EA-89C3-ACBB00BB82DD",
        "PPTH(Parent path)": "source",
        "META": {
            "BASE(Protocol metadata)": {
                "PAWS(S3 protocol version)": "2",
                "ACCT(S3 account ID)": "44084621669730638018",
                "*ctp(HTTP content MIME type)": "binary/octet-stream"
            },
            "BYCB(System metadata)": {
                "CSIZ(Plaintext object size)": "5242880",
                "SHSH(Supplementary Plaintext hash)": "MD5D 0xBAC2A2617C1DFF7E959A76731E6EAF5E",
                "BSIZ(Content block size)": "5252084",
                "CVER(Content block version)": "196612",
                "CTME(Object store begin timestamp)": "2020-02-12T19:16:10.983000",
                "MTME(Object store modified timestamp)": "2020-02-12T19:16:10.983000",
                "ITME": "1581534970983000"
            },
            "CMSM": {
                "LATM(Object last access time)": "2020-02-12T19:16:10.983000"
            },
            "AWS3": {
                "LOCC": "us-east-1"
            }
        },
        "CLCO\(Locations\)": \[
            \{
                "Location Type": "CLDI\(Location online\)",
                "NOID\(Node ID\)": "12448208",
                "VOLI\(Volume ID\)": "3222345473",
                "Object File Path": "/var/local/rangedb/1/p/17/11/00rH0%DkRt78Ila\#3udu",
                "LTIM\(Location timestamp\)": "2020-02-12T19:36:17.880569"
            \},
            \{
                "Location Type": "CLDI\(Location online\)",
                "NOID\(Node ID\)": "12288733",
                "VOLI\(Volume ID\)": "3222345984",
                "Object File Path": "/var/local/rangedb/0/p/19/11/00rH0%DkRt78Rrb\#3s;L",
                "LTIM\(Location timestamp\)": "2020-02-12T19:36:17.934425"
            }
        ]
    }
    1. 从 LDR 控制台注销。输入 …​ exit

  5. 在管理节点中,搜索此对象的 ORLM 审核消息的审核日志,以确认信息生命周期管理( ILM )已根据需要放置副本。

    1. 登录到网格节点:

      1. 输入以下命令: ssh admin@grid_node_IP

      2. 输入中列出的密码 Passwords.txt 文件

      3. 输入以下命令切换到root: su -

      4. 输入中列出的密码 Passwords.txt 文件以root用户身份登录后、提示符将从变为 $ to #

    2. 更改为审核日志所在的目录: cd /var/local/audit/export/

    3. 使用 grep 将与对象关联的审核消息提取到输出文件中。输入 …​ grep uuid-valueaudit_file_name > output_file_name

      例如:

      Admin: # grep 926026C4-00A4-449B-AC72-BCCA72DD1311 audit.log > messages_about_restored_object.txt
    4. 使用 grep 从此输出文件中提取对象规则已满足( ORLM )审核消息。输入 …​ grep ORLM output_file_name

      例如:

      Admin: # grep ORLM messages_about_restored_object.txt

      ORLM 审核消息类似于此示例消息。

    [AUDT:[CBID(UI64):0x38186FE53E3C49A5][RULE(CSTR):"Make 2 Copies"]
    [STAT(FC32):DONE][CSIZ(UI64):0][UUID(CSTR):"926026C4-00A4-449B-AC72-BCCA72DD1311"]
    [LOCS(CSTR):"**CLDI 12828634 2148730112**, CLDI 12745543 2147552014"]
    [RSLT(FC32):SUCS][AVER(UI32):10][ATYP(FC32):ORLM][ATIM(UI64):1563398230669]
    [ATID(UI64):15494889725796157557][ANID(UI32):13100453][AMID(FC32):BCMS]]
    1. 在审核消息中找到 LOC 字段。

      如果存在,则在 LOM 中的 CLDI 值为节点 ID 和创建对象副本的卷 ID 。此消息显示已应用 ILM ,并且已在网格中的两个位置创建两个对象副本。

  6. "重置丢失和丢失的对象计数" 在网格管理器中。