플랫폼 서비스 문제 해결
플랫폼 서비스에서 사용되는 엔드포인트는 테넌트 관리자의 테넌트 사용자가 만들고 유지 관리합니다. 그러나 테넌트가 플랫폼 서비스를 구성하거나 사용하는 데 문제가 있는 경우 Grid Manager를 사용하여 문제를 해결할 수 있습니다.
새로운 엔드포인트 관련 문제
테넌트가 플랫폼 서비스를 사용하려면 먼저 테넌트 관리자를 사용하여 하나 이상의 엔드포인트를 만들어야 합니다. 각 엔드포인트는 StorageGRID S3 버킷, Amazon Web Services 버킷, Amazon Simple Notification Service 주제, Kafka 주제 또는 로컬이나 AWS에 호스팅된 Elasticsearch 클러스터와 같은 하나의 플랫폼 서비스에 대한 외부 대상을 나타냅니다. 각 엔드포인트에는 외부 리소스의 위치와 해당 리소스에 액세스하는 데 필요한 자격 증명이 모두 포함됩니다.
테넌트가 엔드포인트를 생성하면 StorageGRID 시스템은 엔드포인트가 존재하는지, 지정된 자격 증명을 사용하여 접근할 수 있는지 확인합니다. 각 사이트의 한 노드에서 엔드포인트에 대한 연결이 검증됩니다.
엔드포인트 검증에 실패하면 오류 메시지가 나타나 엔드포인트 검증이 실패한 이유를 설명합니다. 테넌트 사용자는 문제를 해결한 후 엔드포인트를 다시 만들어 보세요.
|
|
테넌트 계정에 대해 플랫폼 서비스가 활성화되어 있지 않으면 엔드포인트 생성이 실패합니다. |
기존 엔드포인트 문제
StorageGRID 기존 엔드포인트에 접근하려고 할 때 오류가 발생하면 테넌트 관리자의 대시보드에 메시지가 표시됩니다.
테넌트 사용자는 엔드포인트 페이지로 이동하여 각 엔드포인트에 대한 최신 오류 메시지를 검토하고 오류가 발생한 지 얼마나 되었는지 확인할 수 있습니다. 마지막 오류 열에는 각 엔드포인트에 대한 가장 최근 오류 메시지가 표시되고 오류가 발생한 지 얼마나 되었는지가 나타납니다. 다음을 포함하는 오류
아이콘은 지난 7일 이내에 발생했습니다.
|
|
마지막 오류 열의 일부 오류 메시지에는 괄호 안에 logID가 포함될 수 있습니다. 그리드 관리자나 기술 지원 담당자는 이 ID를 사용하여 bycast.log에서 오류에 대한 더 자세한 정보를 찾을 수 있습니다. |
프록시 서버 관련 문제
구성한 경우"스토리지 프록시" 스토리지 노드와 플랫폼 서비스 엔드포인트 사이에서 프록시 서비스가 StorageGRID 의 메시지를 허용하지 않으면 오류가 발생할 수 있습니다. 이러한 문제를 해결하려면 프록시 서버 설정을 확인하여 플랫폼 서비스 관련 메시지가 차단되지 않는지 확인하세요.
오류가 발생했는지 확인하세요
지난 7일 이내에 엔드포인트 오류가 발생한 경우 테넌트 관리자의 대시보드에 경고 메시지가 표시됩니다. 오류에 대한 자세한 내용을 보려면 Endpoints 페이지로 이동하세요.
클라이언트 작업이 실패합니다
일부 플랫폼 서비스 문제로 인해 S3 버킷의 클라이언트 작업이 실패할 수 있습니다. 예를 들어, 내부 복제 상태 머신(RSM) 서비스가 중지되거나 전달을 위해 대기 중인 플랫폼 서비스 메시지가 너무 많으면 S3 클라이언트 작업이 실패합니다.
서비스 상태를 확인하려면:
-
지원 > 도구 > *그리드 토폴로지*를 선택하세요.
-
사이트 > 스토리지 노드 > SSM > *서비스*를 선택합니다.
복구 가능한 엔드포인트 오류와 복구 불가능한 엔드포인트 오류
엔드포인트가 생성된 후 다양한 이유로 플랫폼 서비스 요청 오류가 발생할 수 있습니다. 일부 오류는 사용자 개입으로 복구할 수 있습니다. 예를 들어, 복구 가능한 오류는 다음과 같은 이유로 발생할 수 있습니다.
-
사용자의 자격 증명이 삭제되었거나 만료되었습니다.
-
대상 버킷이 존재하지 않습니다.
-
알림을 전달할 수 없습니다.
StorageGRID 복구 가능한 오류가 발생하면 플랫폼 서비스 요청은 성공할 때까지 다시 시도됩니다.
다른 오류는 복구할 수 없습니다. 예를 들어, 엔드포인트가 삭제되면 복구할 수 없는 오류가 발생합니다.
StorageGRID 복구할 수 없는 엔드포인트 오류가 발생하는 경우:
-
그리드 관리자에서 지원 > 도구 > 메트릭 > Grafana > *플랫폼 서비스 개요*로 이동하여 오류 세부 정보를 확인하세요.
-
테넌트 관리자에서 저장소(S3) > *플랫폼 서비스 엔드포인트*로 이동하여 오류 세부 정보를 확인하세요.
-
확인하다
/var/local/log/bycast-err.log관련 오류에 대해서. ADC 서비스가 있는 스토리지 노드에는 이 로그 파일이 있습니다.
플랫폼 서비스 메시지를 전달할 수 없습니다.
대상에서 플랫폼 서비스 메시지를 수락하지 못하게 하는 문제가 발생하면 버킷에 대한 클라이언트 작업은 성공하지만 플랫폼 서비스 메시지는 전달되지 않습니다. 예를 들어, 대상에서 자격 증명이 업데이트되어 StorageGRID 더 이상 대상 서비스를 인증할 수 없는 경우 이 오류가 발생할 수 있습니다.
관련 알림을 확인하세요.
플랫폼 서비스 요청에 대한 성능 저하
StorageGRID 소프트웨어는 대상 엔드포인트가 요청을 수신할 수 있는 속도를 초과하는 요청 전송 속도를 초과하는 경우 버킷에 대한 수신 S3 요청을 제한할 수 있습니다. 제한은 대상 엔드포인트로 전송되기를 기다리는 요청이 잔뜩 쌓여 있는 경우에만 발생합니다.
유일하게 눈에 띄는 효과는 들어오는 S3 요청을 실행하는 데 시간이 더 걸린다는 것입니다. 성능이 현저히 저하되는 것을 감지하면 수집 속도를 낮추거나 용량이 더 큰 엔드포인트를 사용해야 합니다. 요청 백로그가 계속해서 늘어나면 클라이언트 S3 작업(예: PUT 요청)이 결국 실패하게 됩니다.
CloudMirror 요청은 일반적으로 검색 통합이나 이벤트 알림 요청보다 더 많은 데이터 전송이 포함되므로 대상 엔드포인트의 성능에 영향을 받을 가능성이 더 큽니다.
플랫폼 서비스 요청이 실패합니다.
플랫폼 서비스에 대한 요청 실패율을 보려면:
-
*노드*를 선택하세요.
-
사이트 > *플랫폼 서비스*를 선택하세요.
-
요청 오류율 차트를 확인하세요.
플랫폼 서비스를 사용할 수 없음 알림
플랫폼 서비스를 사용할 수 없음 경고는 RSM 서비스가 있는 스토리지 노드 중 실행 중이거나 사용 가능한 스토리지 노드가 너무 적어 사이트에서 플랫폼 서비스 작업을 수행할 수 없음을 나타냅니다.
RSM 서비스는 플랫폼 서비스 요청이 각각의 엔드포인트로 전송되도록 보장합니다.
이 경고를 해결하려면 사이트의 어떤 스토리지 노드에 RSM 서비스가 포함되어 있는지 확인하세요. (RSM 서비스는 ADC 서비스를 포함하는 스토리지 노드에도 존재합니다.) 그런 다음, 해당 스토리지 노드의 대부분이 실행 중이고 사용 가능한지 확인합니다.
|
|
사이트에서 RSM 서비스를 포함하는 두 개 이상의 스토리지 노드에 장애가 발생하면 해당 사이트에 대한 보류 중인 플랫폼 서비스 요청이 모두 손실됩니다. |
플랫폼 서비스 엔드포인트에 대한 추가 문제 해결 지침
추가 정보는 다음을 참조하세요."테넌트 계정 사용 > 플랫폼 서비스 엔드포인트 문제 해결" .