본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

드라이브를 교체합니다

다음은 클러스터에서 장애가 발생한 드라이브를 교체하는 데 필요한 단계에 대한 개요입니다.

  • 노드에 SSH를 연결합니다

    • 활성 드라이브 목록을 가져옵니다.

    • 노드에 연결된 모든 드라이브 목록을 가져옵니다.

  • 사용 가능한 드라이브를 식별합니다.

  • 장애가 발생한 드라이브의 CR(사용자 지정 리소스)에 대한 알림을 받습니다.

  • 드라이브를 교체합니다.

  • 드라이브가 성공적으로 교체되었으며 클러스터 CR에서 활성 상태인지 확인합니다.

단계
  1. 클러스터 세부 정보 확인:

     kubectl describe <cluster_ID> -n

    샘플:

     kubectl describe adscl -n astrads-system
  2. 노드에 SSH:

     ssh root@<ip_address>
  3. 해당 노드의 모든 활성 드라이브를 나열합니다.

     runc exec -t firetap /sf/packages/netapp-photon/cmd_firestorm.py -c 'disk show'

    응답:

     DISK   OWNER        POOL   SERIAL  HOME        DR HOME
     -----  ----------   -----  ------  ---------   -------
     v0.0   fires-9(09)  Pool0  1234   fires-9(09)
     v0.1   fires-9(09)  Pool0  5678   fires-9(09)
     v0.2   fires-9(09)  Pool0  9101   fires-9(09)
     v0.3   fires-9(09)  Pool0  1213   fires-9(09)
  4. 해당 노드의 모든 드라이브를 나열합니다.

     lsblk -o NAME,SERIAL,SIZE
    kubectl describe adscl -n astrads-system
  5. 노드에 SSH:

    ssh root@<ip_address>
  6. 해당 노드의 모든 활성 드라이브를 나열합니다.

    runc exec -t firetap /sf/packages/netapp-photon/cmd_firestorm.py -c 'disk show'

    응답:

     DISK    OWNER        POOL   SERIAL  HOME        DR HOME
     ------  ----------   -----  ------  ---------   -------
     v0.0    fires-9(09)  Pool0  1234   fires-9(09)
     v0.1    fires-9(09)  Pool0  5678   fires-9(09)
     v0.2    fires-9(09)  Pool0  9101   fires-9(09)
     v0.3    fires-9(09)  Pool0  1213   fires-9(09)
  7. 해당 노드의 모든 드라이브를 나열합니다.

    - lsblk -o NAME,SERIAL,SIZE
  8. 장애가 발생한 드라이브 CR 생성:

     kubectl get adsfd -n astrads-system

    응답:

     NAME                                   AGE
     158c66c5-3e84-5530-8ede-d8e3cbbf67af   37s
  9. 실패한 드라이브 세부 정보 가져오기:

     Name:         158c66c5-3e84-5530-8ede-d8e3cbbf67af
    Namespace:    astrads-system
    Labels:       <none>
    Annotations:  <none>
    API Version:  astrads.netapp.io/v1alpha1
    Kind:         AstraDSFailedDrive
    Metadata:
     Creation Timestamp:  2021-10-26T06:36:12Z
     Generation:          1
     Managed Fields:
       API Version:  astrads.netapp.io/v1alpha1
       Fields Type:  FieldsV1
       fieldsV1:
         f:spec:
           .:
           f:executeReplace:
           f:replaceWith:
         f:status:
           .:
           f:cluster:
           f:failedDriveInfo:
             .:
             f:failureReason:
             f:firetapUUID:
             f:inUse:
             f:name:
             f:node:
             f:path:
             f:present:
             f:serial:
             f:sizeBytes:
           f:state:
       Manager:         cluster-controller
       Operation:       Update
       Time:            2021-10-26T06:36:12Z
     Resource Version:  4110227
     UID:               14a2c23b-fcd8-4b04-ae25-48c75abc0682
    Spec:
     Execute Replace:  false
     Replace With:
    Status:
     Cluster:  astrads-cluster-493a7f8
     Failed Drive Info:
       Failure Reason:  AdminFailed
       Firetap UUID:    158c66c5-3e84-5530-8ede-d8e3cbbf67af
       In Use:          false
       Name:            scsi-36000c29abd71fd0dad31270af16bb1bc
       Node:            sti-b200-0214b.ctl.gdl.englab.netapp.com
       Path:            /dev/disk/by-id/scsi-36000c29abd71fd0dad31270af16bb1bc
       Present:         false
       Serial:          6000c29abd71fd0dad31270af16bb1bc
       Size Bytes:      107374182400
     State:             ReadyToReplace
    Events:              <none>
  10. 장애가 발생한 드라이브 CR을 편집하여 사용 가능한 드라이브로 교체합니다.

     kubectl edit adsfd -n astrads-system

    응답:

     astradsfaileddrive.astrads.netapp.io/158c66c5-3e84-5530-8ede-d8e3cbbf67af edited
    ...
    Spec:
      Execute Replace:  true
      Replace With:     6000c2949046697ae1c738208ffc6620
    ...
  11. 드라이브가 클러스터 CR 및 노드에서 활성 상태인지 확인합니다.

 kubectl describe adscl -n astrads-system
 ...
 Status:              Added
    Drive Statuses:
      Drive ID:       d6a4383b-305f-54d9-8264-990ff2964c15
      Drive Name:     scsi-36000c2949046697ae1c738208ffc6620
      Drive Serial:   6000c2949046697ae1c738208ffc6620
      Drives Status:  Available
      Drive ID:       55389866-fb73-57fd-9db8-96d5c78ea650
      Drive Name:     scsi-36000c29e16433c39e4d888b1dbbab6cf
      Drive Serial:   6000c29e16433c39e4d888b1dbbab6cf
      Drives Status:  Active
      Drive ID:       fc9b555d-0752-5497-ac79-a6e79d9a9ad0
      Drive Name:     scsi-36000c29fdafda4ab8852cc636c86b3c4
      Drive Serial:   6000c29fdafda4ab8852cc636c86b3c4
      Drives Status:  Active
      Drive ID:       a8bfd69b-c234-508b-882a-947508416d4f
      Drive Name:     scsi-36000c29339215b755d777ae20593e23b
      Drive Serial:   6000c29339215b755d777ae20593e23b
      Drives Status:  Active
    Maintenance Status:
      State:             Disabled
      Variant:           None
    Node HA:             true
    Node ID:             4
    Node Is Reachable:   true
    Node Management IP:  10.224.8.75
    Node Name:           sti-b200-0214b.ctl.gdl.englab.netapp.com
    Node Role:           Storage
    Node UUID:           29998974-a619-5269-86e2-f2aaaaaae107
    Node Version:        12.75.0.6169843
    Status:              Added
...