简体中文版经机器翻译而成，仅供参考。如与英语版出现任何冲突，应以英语版为准。

识别并卸载 StorageGRID 中的故障存储卷

03/18/2026 贡献者

PDF

在恢复包含故障存储卷的存储节点时，您必须确定并卸载故障卷。您必须验证在恢复操作步骤中仅重新格式化故障存储卷。

开始之前

您已使用登录到网格管理器"支持的 Web 浏览器"。

关于此任务

您应尽快恢复发生故障的存储卷。

恢复过程的第一步是检测已断开连接，需要卸载或存在 I/O 错误的卷。如果故障卷仍然连接，但文件系统随机损坏，则系统可能无法检测到磁盘中未使用或未分配的部分有任何损坏。

您必须先完成此操作步骤，然后再执行手动步骤来恢复卷，例如添加或重新连接磁盘，停止节点，启动节点或重新启动。否则、在运行脚本时 reformat_storage_block_devices.rb、您可能会遇到文件系统错误、从而导致脚本挂起或失败。

在运行命令之前、请修复硬件并正确连接磁盘 reboot。

请仔细识别故障存储卷。您将使用此信息验证哪些卷必须重新格式化。重新格式化卷后、卷上的数据将无法恢复。

要恢复故障存储卷，您需要知道故障存储卷的设备名称及其卷 ID。

在安装时，每个存储设备都分配一个文件系统通用唯一标识符 (UUID)，并使用该分配的文件系统 UUID 安装到存储节点上的 rangedb 目录。文件系统 UUID 和 rangedb 目录列在 `/etc/fstab`文件。网格管理器中显示卷的挂载点、设备名称和大小。

步骤

完成以下步骤以记录故障存储卷及其设备名称：
1. 选择节点 > 站点 > 故障存储节点 > 存储。
2. 向下滚动以找到卷表和对象存储表，并记录每个状态为未知或离线的卷的以下信息。
  - 从卷表中，记录安装点、设备和大小。
  - 从对象存储表中，记录 object_store_ID。
    
    `object_store_ID`是发生故障的存储卷的ID。例如、在命令中为ID为0000的对象存储指定 `0`。
登录到发生故障的存储节点：
1. 输入以下命令： ssh admin@grid_node_IP
2. 输入文件中列出的密码 Passwords.txt。
3. 输入以下命令切换到root： su -
4. 输入文件中列出的密码 Passwords.txt。
  
  当您以root用户身份登录时，提示符将从更 $`改为 `#。
运行以下脚本以卸载发生故障的存储卷：

sn-unmount-volume object_store_ID

如果出现提示，请按*y*停止Cassand拉服务，具体取决于存储卷0。

如果Cassand拉服务已停止、则不会出现提示。仅对卷 0 停止 Cassandra 服务。

root@Storage-180:~/var/local/tmp/storage~ # sn-unmount-volume 0
Services depending on storage volume 0 (cassandra) aren't down.
Services depending on storage volume 0 must be stopped before running this script.
Stop services that require storage volume 0 [y/N]? y
Shutting down services that require storage volume 0.
Services requiring storage volume 0 stopped.
Unmounting /var/local/rangedb/0
/var/local/rangedb/0 is unmounted.

几秒钟后、此卷将被卸载。此时将显示消息，指示此过程的每个步骤。最后一条消息指示卷已卸载。

如果卸载因卷繁忙而失败、您可以使用选项强制卸载 --use-umountof：

使用选项强制卸载 `--use-umountof`可能会导致使用此卷的进程或服务行为异常或崩溃。

root@Storage-180:~ # sn-unmount-volume --use-umountof /var/local/rangedb/2
Unmounting /var/local/rangedb/2 using umountof
/var/local/rangedb/2 is unmounted.
Informing LDR service of changes to storage volumes

识别并卸载 StorageGRID 中的故障存储卷

Creating your file...