본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.
드라이브를 교체합니다
다음은 클러스터에서 장애가 발생한 드라이브를 교체하는 데 필요한 단계에 대한 개요입니다.
-
노드에 SSH를 연결합니다
-
활성 드라이브 목록을 가져옵니다.
-
노드에 연결된 모든 드라이브 목록을 가져옵니다.
-
-
사용 가능한 드라이브를 식별합니다.
-
장애가 발생한 드라이브의 CR(사용자 지정 리소스)에 대한 알림을 받습니다.
-
드라이브를 교체합니다.
-
드라이브가 성공적으로 교체되었으며 클러스터 CR에서 활성 상태인지 확인합니다.
단계
-
클러스터 세부 정보 확인:
kubectl describe <cluster_ID> -n
샘플:
kubectl describe adscl -n astrads-system
-
노드에 SSH:
ssh root@<ip_address>
-
해당 노드의 모든 활성 드라이브를 나열합니다.
runc exec -t firetap /sf/packages/netapp-photon/cmd_firestorm.py -c 'disk show'
응답:
DISK OWNER POOL SERIAL HOME DR HOME ----- ---------- ----- ------ --------- ------- v0.0 fires-9(09) Pool0 1234 fires-9(09) v0.1 fires-9(09) Pool0 5678 fires-9(09) v0.2 fires-9(09) Pool0 9101 fires-9(09) v0.3 fires-9(09) Pool0 1213 fires-9(09)
-
해당 노드의 모든 드라이브를 나열합니다.
lsblk -o NAME,SERIAL,SIZE kubectl describe adscl -n astrads-system
-
노드에 SSH:
ssh root@<ip_address>
-
해당 노드의 모든 활성 드라이브를 나열합니다.
runc exec -t firetap /sf/packages/netapp-photon/cmd_firestorm.py -c 'disk show'
응답:
DISK OWNER POOL SERIAL HOME DR HOME ------ ---------- ----- ------ --------- ------- v0.0 fires-9(09) Pool0 1234 fires-9(09) v0.1 fires-9(09) Pool0 5678 fires-9(09) v0.2 fires-9(09) Pool0 9101 fires-9(09) v0.3 fires-9(09) Pool0 1213 fires-9(09)
-
해당 노드의 모든 드라이브를 나열합니다.
- lsblk -o NAME,SERIAL,SIZE
-
장애가 발생한 드라이브 CR 생성:
kubectl get adsfd -n astrads-system
응답:
NAME AGE 158c66c5-3e84-5530-8ede-d8e3cbbf67af 37s
-
실패한 드라이브 세부 정보 가져오기:
Name: 158c66c5-3e84-5530-8ede-d8e3cbbf67af Namespace: astrads-system Labels: <none> Annotations: <none> API Version: astrads.netapp.io/v1alpha1 Kind: AstraDSFailedDrive Metadata: Creation Timestamp: 2021-10-26T06:36:12Z Generation: 1 Managed Fields: API Version: astrads.netapp.io/v1alpha1 Fields Type: FieldsV1 fieldsV1: f:spec: .: f:executeReplace: f:replaceWith: f:status: .: f:cluster: f:failedDriveInfo: .: f:failureReason: f:firetapUUID: f:inUse: f:name: f:node: f:path: f:present: f:serial: f:sizeBytes: f:state: Manager: cluster-controller Operation: Update Time: 2021-10-26T06:36:12Z Resource Version: 4110227 UID: 14a2c23b-fcd8-4b04-ae25-48c75abc0682 Spec: Execute Replace: false Replace With: Status: Cluster: astrads-cluster-493a7f8 Failed Drive Info: Failure Reason: AdminFailed Firetap UUID: 158c66c5-3e84-5530-8ede-d8e3cbbf67af In Use: false Name: scsi-36000c29abd71fd0dad31270af16bb1bc Node: sti-b200-0214b.ctl.gdl.englab.netapp.com Path: /dev/disk/by-id/scsi-36000c29abd71fd0dad31270af16bb1bc Present: false Serial: 6000c29abd71fd0dad31270af16bb1bc Size Bytes: 107374182400 State: ReadyToReplace Events: <none>
-
장애가 발생한 드라이브 CR을 편집하여 사용 가능한 드라이브로 교체합니다.
kubectl edit adsfd -n astrads-system
응답:
astradsfaileddrive.astrads.netapp.io/158c66c5-3e84-5530-8ede-d8e3cbbf67af edited ... Spec: Execute Replace: true Replace With: 6000c2949046697ae1c738208ffc6620 ...
-
드라이브가 클러스터 CR 및 노드에서 활성 상태인지 확인합니다.
kubectl describe adscl -n astrads-system ... Status: Added Drive Statuses: Drive ID: d6a4383b-305f-54d9-8264-990ff2964c15 Drive Name: scsi-36000c2949046697ae1c738208ffc6620 Drive Serial: 6000c2949046697ae1c738208ffc6620 Drives Status: Available Drive ID: 55389866-fb73-57fd-9db8-96d5c78ea650 Drive Name: scsi-36000c29e16433c39e4d888b1dbbab6cf Drive Serial: 6000c29e16433c39e4d888b1dbbab6cf Drives Status: Active Drive ID: fc9b555d-0752-5497-ac79-a6e79d9a9ad0 Drive Name: scsi-36000c29fdafda4ab8852cc636c86b3c4 Drive Serial: 6000c29fdafda4ab8852cc636c86b3c4 Drives Status: Active Drive ID: a8bfd69b-c234-508b-882a-947508416d4f Drive Name: scsi-36000c29339215b755d777ae20593e23b Drive Serial: 6000c29339215b755d777ae20593e23b Drives Status: Active Maintenance Status: State: Disabled Variant: None Node HA: true Node ID: 4 Node Is Reachable: true Node Management IP: 10.224.8.75 Node Name: sti-b200-0214b.ctl.gdl.englab.netapp.com Node Role: Storage Node UUID: 29998974-a619-5269-86e2-f2aaaaaae107 Node Version: 12.75.0.6169843 Status: Added ...