Skip to main content
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

StorageGRID 시스템 문제 해결

StorageGRID 시스템을 사용하는 중 문제가 발생하면 이 섹션의 팁과 가이드라인을 참조하여 문제를 확인하고 해결하는 데 도움을 받으세요.

대부분의 경우, 스스로 문제를 해결할 수 있습니다. 하지만 일부 문제는 기술 지원팀에 보고해야 할 수도 있습니다.

문제를 정의하세요

문제를 해결하기 위한 첫 번째 단계는 문제를 명확하게 정의하는 것입니다.

다음 표는 문제를 정의하기 위해 수집할 수 있는 정보 유형의 예를 보여줍니다.

질문 예시 응답

StorageGRID 시스템은 무엇을 하고 있거나, 무엇을 하지 않습니까? 증상은 무엇인가?

클라이언트 애플리케이션에서 객체를 StorageGRID 로 수집할 수 없다고 보고합니다.

문제는 언제 시작되었나요?

객체 수집은 2020년 1월 8일 오후 2시 50분경에 처음으로 거부되었습니다.

처음에 어떻게 문제를 알아차리셨나요?

클라이언트 애플리케이션에서 알림. 또한 알림 이메일도 받았습니다.

문제가 지속적으로 발생합니까, 아니면 가끔만 발생합니까?

문제가 지속되고 있습니다.

문제가 정기적으로 발생하는 경우 어떤 단계로 인해 문제가 발생합니까?

문제는 클라이언트가 객체를 수집하려고 할 때마다 발생합니다.

문제가 간헐적으로 발생한다면 언제 발생합니까? 귀하가 알고 있는 각 사건의 시간을 기록하세요.

문제는 간헐적이지 않습니다.

이런 문제를 본 적이 있나요? 과거에 이런 문제가 얼마나 자주 발생했나요?

이런 문제는 처음 봅니다.

시스템에 대한 위험과 영향을 평가합니다.

문제를 정의한 후 해당 문제가 StorageGRID 시스템에 미치는 위험과 영향을 평가합니다. 예를 들어, 중요한 경고가 있다고 해서 반드시 시스템이 핵심 서비스를 제공하지 않는다는 것을 의미하지는 않습니다.

다음 표는 예제 문제가 시스템 운영에 미치는 영향을 요약한 것입니다.

질문 예시 응답

StorageGRID 시스템이 콘텐츠를 수집할 수 있나요?

아니요.

클라이언트 애플리케이션이 콘텐츠를 검색할 수 있나요?

일부 객체는 검색이 가능하지만, 일부 객체는 검색이 불가능합니다.

데이터가 위험에 처해 있나요?

아니요.

사업 수행 능력에 심각한 영향이 있나요?

네, 클라이언트 애플리케이션은 StorageGRID 시스템에 객체를 저장할 수 없고 데이터를 일관되게 검색할 수 없기 때문입니다.

데이터 수집

문제를 정의하고 위험과 영향을 평가한 후 분석을 위해 데이터를 수집합니다. 어떤 유형의 데이터를 수집하는 것이 가장 유용한지는 문제의 특성에 따라 달라집니다.

수집할 데이터 유형 이 데이터를 수집하는 이유 지침

최근 변경 사항 타임라인 만들기

StorageGRID 시스템, 구성 또는 환경이 변경되면 새로운 동작이 발생할 수 있습니다.

리뷰 알림

알림은 문제의 근본 원인을 빠르게 파악하는 데 도움이 되며, 근본적인 원인이 무엇인지에 대한 중요한 단서를 제공합니다.

현재 알림 목록을 검토하여 StorageGRID 문제의 근본 원인을 파악했는지 확인하세요.

추가적인 통찰력을 얻으려면 과거에 발생한 알림을 검토하세요.

이벤트 모니터링

이벤트에는 네트워크 오류 등의 오류를 포함하여 노드의 모든 시스템 오류나 오류 이벤트가 포함됩니다. 문제에 대해 자세히 알아보거나 문제 해결에 도움이 되도록 이벤트를 모니터링합니다.

차트와 텍스트 보고서를 사용하여 추세 파악

추세는 문제가 처음 나타난 시점에 대한 귀중한 단서를 제공하며, 상황이 얼마나 빨리 변하는지 이해하는 데 도움이 될 수 있습니다.

기준선을 설정하세요

다양한 운영 값의 정상 수준에 대한 정보를 수집합니다. 이러한 기준값과 기준값에서의 편차는 귀중한 단서를 제공할 수 있습니다.

수집 및 검색 테스트 수행

수집 및 검색과 관련된 성능 문제를 해결하려면 워크스테이션을 사용하여 객체를 저장하고 검색합니다. 클라이언트 애플리케이션을 사용할 때 보이는 결과와 비교해보세요.

감사 메시지 검토

StorageGRID 작업을 자세히 추적하려면 감사 메시지를 검토하세요. 감사 메시지의 세부 정보는 성능 문제를 포함한 다양한 유형의 문제를 해결하는 데 유용할 수 있습니다.

객체 위치 및 저장소 무결성 확인

보관에 문제가 있는 경우 물건이 예상한 위치에 놓여 있는지 확인하세요. 스토리지 노드에서 개체 데이터의 무결성을 확인합니다.

기술 지원을 위한 데이터 수집

기술 지원팀은 문제 해결을 위해 데이터를 수집하거나 특정 정보를 검토해 달라고 요청할 수 있습니다.

최근 변경 사항 타임라인을 만듭니다.

문제가 발생하면 최근에 무엇이 변경되었고, 언제 변경되었는지 고려해야 합니다.

  • StorageGRID 시스템, 구성 또는 환경이 변경되면 새로운 동작이 발생할 수 있습니다.

  • 변경 사항 타임라인을 통해 어떤 변경 사항이 문제의 원인인지 파악하고, 각 변경 사항이 문제의 발전에 어떤 영향을 미쳤는지 파악할 수 있습니다.

시스템의 최근 변경 사항에 대한 표를 만듭니다. 여기에는 각 변경 사항이 발생한 시점과 변경 사항에 대한 관련 세부 정보(변경이 진행되는 동안 다른 일이 발생했는지에 대한 정보 포함)가 포함됩니다.

변화의 시간 변경 유형 세부

예를 들어:

  • 언제 노드 복구를 시작했나요?

  • 소프트웨어 업그레이드는 언제 완료되었나요?

  • 당신은 과정을 방해했나요?

무슨 일이에요? 당신은 무엇을 했나요?

변경 사항에 대한 모든 관련 세부 정보를 문서화하세요. 예를 들어:

  • 네트워크 변경 사항에 대한 세부 정보입니다.

  • 어떤 핫픽스가 설치되었나요?

  • 클라이언트 작업 부하가 어떻게 바뀌었는가.

동시에 두 개 이상의 변경 사항이 발생하는 경우 반드시 기록해 두세요. 예를 들어, 업그레이드가 진행되는 동안 이 변경이 이루어졌습니까?

최근의 중요한 변화 사례

잠재적으로 중요한 변화의 몇 가지 예는 다음과 같습니다.

  • StorageGRID 시스템이 최근에 설치, 확장 또는 복구되었습니까?

  • 최근에 시스템이 업그레이드되었나요? 핫픽스가 적용되었나요?

  • 최근에 하드웨어를 수리하거나 교체한 적이 있나요?

  • ILM 정책이 업데이트되었나요?

  • 클라이언트 작업 부하가 변경되었나요?

  • 클라이언트 애플리케이션이나 동작이 변경되었나요?

  • 로드 밸런서를 변경했거나, 관리 노드 또는 게이트웨이 노드의 고가용성 그룹을 추가 또는 제거했나요?

  • 완료하는 데 오랜 시간이 걸릴 수 있는 작업이 시작되었나요? 예를 들면 다음과 같습니다.

    • 실패한 스토리지 노드 복구

    • 스토리지 노드 해체

  • 테넌트 추가나 LDAP 구성 변경 등 사용자 인증에 변경 사항이 있었나요?

  • 데이터 마이그레이션이 진행되고 있나요?

  • 플랫폼 서비스가 최근에 활성화되었거나 변경되었나요?

  • 최근에 규정 준수가 활성화되었나요?

  • 클라우드 스토리지 풀이 추가되었거나 제거되었나요?

  • 저장 압축이나 암호화에 변경 사항이 있었나요?

  • 네트워크 인프라에 변경 사항이 있었나요? 예를 들어 VLAN, 라우터 또는 DNS가 있습니다.

  • NTP 소스에 변경 사항이 있었나요?

  • 그리드, 관리자 또는 클라이언트 네트워크 인터페이스에 변경 사항이 있었나요?

  • StorageGRID 시스템이나 환경에 다른 변경 사항이 있었나요?

기준선을 설정하세요

다양한 운영 값의 정상 수준을 기록하여 시스템의 기준선을 설정할 수 있습니다. 나중에 현재 값을 이러한 기준선과 비교하여 비정상적인 값을 감지하고 해결하는 데 도움이 될 수 있습니다.

재산 가치 얻는 방법

평균 저장 용량 소비량

소비된 GB/일

소비량/일

그리드 관리자로 이동합니다. 노드 페이지에서 전체 그리드 또는 사이트를 선택하고 저장소 탭으로 이동합니다.

사용된 저장 공간 - 개체 데이터 차트에서 선이 비교적 안정적인 기간을 찾으세요. 차트 위에 커서를 놓으면 매일 얼마나 많은 저장 공간이 소모되는지 추정할 수 있습니다.

전체 시스템이나 특정 데이터 센터에 대한 정보를 수집할 수 있습니다.

평균 메타데이터 소비량

소비된 GB/일

소비량/일

그리드 관리자로 이동합니다. 노드 페이지에서 전체 그리드 또는 사이트를 선택하고 저장소 탭으로 이동합니다.

사용된 저장소 - 개체 메타데이터 차트에서 선이 비교적 안정적인 기간을 찾으세요. 차트 위에 커서를 놓으면 매일 얼마나 많은 메타데이터 저장소가 소모되는지 추정할 수 있습니다.

전체 시스템이나 특정 데이터 센터에 대한 정보를 수집할 수 있습니다.

S3/Swift 작업 속도

작업/초

Grid Manager 대시보드에서 성능 > S3 작업 또는 성능 > *Swift 작업*을 선택합니다.

특정 사이트나 노드에 대한 수집 및 검색 속도와 수를 보려면 노드 > 사이트 또는 스토리지 노드 > *개체*를 선택하세요. S3의 Ingest and Retrieve 차트 위에 커서를 올려놓으세요.

실패한 S3/Swift 작업

운영

지원 > 도구 > *그리드 토폴로지*를 선택하세요. API 작업 섹션의 개요 탭에서 S3 작업 - 실패 또는 Swift 작업 - 실패 값을 확인합니다.

ILM 평가율

초당 객체 수

노드 페이지에서 grid > *ILM*을 선택합니다.

ILM 대기열 차트에서 회선이 비교적 안정적인 기간을 찾으세요. 차트 위에 커서를 올려놓으면 시스템의 *평가율*에 대한 기준값을 추정할 수 있습니다.

ILM 스캔 속도

초당 객체 수

NODES > grid > *ILM*을 선택합니다.

ILM 대기열 차트에서 회선이 비교적 안정적인 기간을 찾으세요. 차트 위에 커서를 올려놓으면 시스템의 *스캔 속도*에 대한 기준값을 추정할 수 있습니다.

클라이언트 작업에서 대기 중인 객체

초당 객체 수

NODES > grid > *ILM*을 선택합니다.

ILM 대기열 차트에서 회선이 비교적 안정적인 기간을 찾으세요. 시스템의 *클라이언트 작업에서 대기 중인 개체*에 대한 기준값을 추정하려면 차트 위에 커서를 놓습니다.

평균 쿼리 지연 시간

밀리초

노드 > 스토리지 노드 > *객체*를 선택합니다. 쿼리 테이블에서 평균 대기 시간 값을 확인합니다.

데이터 분석

수집한 정보를 사용하여 문제의 원인과 잠재적 해결책을 파악합니다.

분석은 문제에 따라 다르지만 일반적으로 다음과 같습니다.

  • 알림을 사용하여 장애 지점과 병목 현상을 찾습니다.

  • 경고 내역과 차트를 사용하여 문제 내역을 재구성합니다.

  • 차트를 사용하여 이상 현상을 찾고 문제 상황을 정상적인 작업과 비교합니다.

에스컬레이션 정보 체크리스트

스스로 문제를 해결할 수 없는 경우 기술 지원팀에 문의하세요. 기술 지원팀에 문의하기 전에 다음 표에 나열된 정보를 수집하여 문제 해결을 용이하게 하세요.

체크 표시 노트

문제 진술

문제의 증상은 무엇입니까? 문제는 언제 시작되었나요? 지속적으로 발생하나요, 아니면 간헐적으로 발생하나요? 간헐적으로 발생했다면, 언제 발생했습니까?

영향 평가

문제의 심각성은 어느 정도입니까? 클라이언트 애플리케이션에 어떤 영향이 있나요?

  • 클라이언트가 이전에 성공적으로 연결한 적이 있나요?

  • 클라이언트가 데이터를 수집, 검색, 삭제할 수 있나요?

StorageGRID 시스템 ID

유지관리 > 시스템 > *라이선스*를 선택하세요. StorageGRID 시스템 ID는 현재 라이센스의 일부로 표시됩니다.

소프트웨어 버전

Grid Manager 상단에서 도움말 아이콘을 선택하고 *정보*를 선택하면 StorageGRID 버전을 확인할 수 있습니다.

사용자 정의

StorageGRID 시스템이 어떻게 구성되어 있는지 요약해 보세요. 예를 들어 다음을 나열해 보세요.

  • 그리드는 저장 압축, 저장 암호화 또는 규정 준수를 사용합니까?

  • ILM은 복제된 객체나 삭제된 객체를 만들까요? ILM은 사이트 중복성을 보장합니까? ILM 규칙은 균형, 엄격 또는 이중 커밋 수집 동작을 사용합니까?

로그 파일 및 시스템 데이터

시스템의 로그 파일과 시스템 데이터를 수집합니다. 지원 > 도구 > *로그*를 선택하세요.

전체 그리드 또는 선택한 노드에 대한 로그를 수집할 수 있습니다.

선택한 노드에 대한 로그만 수집하는 경우 ADC 서비스가 있는 스토리지 노드를 하나 이상 포함해야 합니다. (사이트의 처음 세 개의 스토리지 노드에는 ADC 서비스가 포함됩니다.)

기준 정보

수집 작업, 검색 작업 및 저장소 소비에 대한 기준 정보를 수집합니다.

최근 변경 사항 타임라인

시스템이나 환경의 최근 변경 사항을 요약한 타임라인을 만듭니다.

문제 진단을 위한 노력의 역사

문제를 직접 진단하거나 해결하기 위한 조치를 취한 경우, 취한 조치와 결과를 기록해 두세요.