日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

ドライブを交換します

以下に、クラスタ内の障害が発生したドライブを交換する手順の概要を示します。

  • ノードに SSH 接続します

    • アクティブドライブのリストを取得します。

    • ノードにリンクされているすべてのドライブのリストを取得します。

  • 使用可能なドライブを特定します。

  • ドライブのカスタムリソース( CR )に障害が発生したことを確認します。

  • ドライブを交換します。

  • ドライブが正常に交換され、クラスタ CR でアクティブになっていることを確認します。

手順
  1. クラスタの詳細を取得します。

     kubectl describe <cluster_ID> -n

    サンプル:

     kubectl describe adscl -n astrads-system
  2. ノードに SSH 接続します。

     ssh root@<ip_address>
  3. そのノードのアクティブドライブをすべて表示します。

     runc exec -t firetap /sf/packages/netapp-photon/cmd_firestorm.py -c 'disk show'

    対応:

     DISK   OWNER        POOL   SERIAL  HOME        DR HOME
     -----  ----------   -----  ------  ---------   -------
     v0.0   fires-9(09)  Pool0  1234   fires-9(09)
     v0.1   fires-9(09)  Pool0  5678   fires-9(09)
     v0.2   fires-9(09)  Pool0  9101   fires-9(09)
     v0.3   fires-9(09)  Pool0  1213   fires-9(09)
  4. そのノードのすべてのドライブを表示します。

     lsblk -o NAME,SERIAL,SIZE
    kubectl describe adscl -n astrads-system
  5. ノードに SSH 接続します。

    ssh root@<ip_address>
  6. そのノードのアクティブドライブをすべて表示します。

    runc exec -t firetap /sf/packages/netapp-photon/cmd_firestorm.py -c 'disk show'

    対応:

     DISK    OWNER        POOL   SERIAL  HOME        DR HOME
     ------  ----------   -----  ------  ---------   -------
     v0.0    fires-9(09)  Pool0  1234   fires-9(09)
     v0.1    fires-9(09)  Pool0  5678   fires-9(09)
     v0.2    fires-9(09)  Pool0  9101   fires-9(09)
     v0.3    fires-9(09)  Pool0  1213   fires-9(09)
  7. そのノードのすべてのドライブを表示します。

    - lsblk -o NAME,SERIAL,SIZE
  8. 障害が発生したドライブ CR を作成します。

     kubectl get adsfd -n astrads-system

    対応:

     NAME                                   AGE
     158c66c5-3e84-5530-8ede-d8e3cbbf67af   37s
  9. 障害ドライブの詳細を取得します。

     Name:         158c66c5-3e84-5530-8ede-d8e3cbbf67af
    Namespace:    astrads-system
    Labels:       <none>
    Annotations:  <none>
    API Version:  astrads.netapp.io/v1alpha1
    Kind:         AstraDSFailedDrive
    Metadata:
     Creation Timestamp:  2021-10-26T06:36:12Z
     Generation:          1
     Managed Fields:
       API Version:  astrads.netapp.io/v1alpha1
       Fields Type:  FieldsV1
       fieldsV1:
         f:spec:
           .:
           f:executeReplace:
           f:replaceWith:
         f:status:
           .:
           f:cluster:
           f:failedDriveInfo:
             .:
             f:failureReason:
             f:firetapUUID:
             f:inUse:
             f:name:
             f:node:
             f:path:
             f:present:
             f:serial:
             f:sizeBytes:
           f:state:
       Manager:         cluster-controller
       Operation:       Update
       Time:            2021-10-26T06:36:12Z
     Resource Version:  4110227
     UID:               14a2c23b-fcd8-4b04-ae25-48c75abc0682
    Spec:
     Execute Replace:  false
     Replace With:
    Status:
     Cluster:  astrads-cluster-493a7f8
     Failed Drive Info:
       Failure Reason:  AdminFailed
       Firetap UUID:    158c66c5-3e84-5530-8ede-d8e3cbbf67af
       In Use:          false
       Name:            scsi-36000c29abd71fd0dad31270af16bb1bc
       Node:            sti-b200-0214b.ctl.gdl.englab.netapp.com
       Path:            /dev/disk/by-id/scsi-36000c29abd71fd0dad31270af16bb1bc
       Present:         false
       Serial:          6000c29abd71fd0dad31270af16bb1bc
       Size Bytes:      107374182400
     State:             ReadyToReplace
    Events:              <none>
  10. 障害が発生したドライブ CR を編集して、使用可能なドライブに交換します。

     kubectl edit adsfd -n astrads-system

    対応:

     astradsfaileddrive.astrads.netapp.io/158c66c5-3e84-5530-8ede-d8e3cbbf67af edited
    ...
    Spec:
      Execute Replace:  true
      Replace With:     6000c2949046697ae1c738208ffc6620
    ...
  11. クラスタ CR とノードでドライブがアクティブであることを確認します。

 kubectl describe adscl -n astrads-system
 ...
 Status:              Added
    Drive Statuses:
      Drive ID:       d6a4383b-305f-54d9-8264-990ff2964c15
      Drive Name:     scsi-36000c2949046697ae1c738208ffc6620
      Drive Serial:   6000c2949046697ae1c738208ffc6620
      Drives Status:  Available
      Drive ID:       55389866-fb73-57fd-9db8-96d5c78ea650
      Drive Name:     scsi-36000c29e16433c39e4d888b1dbbab6cf
      Drive Serial:   6000c29e16433c39e4d888b1dbbab6cf
      Drives Status:  Active
      Drive ID:       fc9b555d-0752-5497-ac79-a6e79d9a9ad0
      Drive Name:     scsi-36000c29fdafda4ab8852cc636c86b3c4
      Drive Serial:   6000c29fdafda4ab8852cc636c86b3c4
      Drives Status:  Active
      Drive ID:       a8bfd69b-c234-508b-882a-947508416d4f
      Drive Name:     scsi-36000c29339215b755d777ae20593e23b
      Drive Serial:   6000c29339215b755d777ae20593e23b
      Drives Status:  Active
    Maintenance Status:
      State:             Disabled
      Variant:           None
    Node HA:             true
    Node ID:             4
    Node Is Reachable:   true
    Node Management IP:  10.224.8.75
    Node Name:           sti-b200-0214b.ctl.gdl.englab.netapp.com
    Node Role:           Storage
    Node UUID:           29998974-a619-5269-86e2-f2aaaaaae107
    Node Version:        12.75.0.6169843
    Status:              Added
...