본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

경고 참조

기여자

다음 표에는 모든 기본 StorageGRID 경고가 나와 있습니다. 필요에 따라 시스템 관리 방식에 맞게 사용자 지정 경고 규칙을 만들 수 있습니다.

에 대한 정보를 참조하십시오 일반적으로 사용되는 Prometheus 메트릭입니다 이러한 알림 중 일부에 사용된 메트릭에 대해 알아봅니다.

경고 이름입니다 설명 및 권장 조치

어플라이언스 배터리가 만료되었습니다

제품의 저장소 컨트롤러 배터리가 만료되었습니다.

  1. 배터리를 교체합니다. 전지 분리 및 교체 단계는 저장 컨트롤러 교체 절차에 포함되어 있습니다. 스토리지 어플라이언스에 대한 지침을 참조하십시오.

  2. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

어플라이언스 배터리 고장

제품의 저장소 컨트롤러 에 있는 배터리가 실패했습니다.

  1. 배터리를 교체합니다. 전지 분리 및 교체 단계는 저장 컨트롤러 교체 절차에 포함되어 있습니다. 스토리지 어플라이언스에 대한 지침을 참조하십시오.

  2. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

어플라이언스 배터리가 학습된 용량이 부족합니다

제품의 저장 장치 컨트롤러의 배터리가 학습된 용량이 부족합니다.

  1. 배터리를 교체합니다. 전지 분리 및 교체 단계는 저장 컨트롤러 교체 절차에 포함되어 있습니다. 스토리지 어플라이언스에 대한 지침을 참조하십시오.

  2. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

어플라이언스 배터리 수명이 거의 다 되었습니다

어플라이언스 저장소 컨트롤러의 배터리 수명이 거의 다했습니다.

  1. 배터리를 곧 교체하십시오. 전지 분리 및 교체 단계는 저장 컨트롤러 교체 절차에 포함되어 있습니다. 스토리지 어플라이언스에 대한 지침을 참조하십시오.

  2. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

제품 배터리가 제거되었습니다

제품의 저장 컨트롤러에 배터리가 없습니다.

  1. 배터리를 장착하십시오. 전지 분리 및 교체 단계는 저장 컨트롤러 교체 절차에 포함되어 있습니다. 스토리지 어플라이언스에 대한 지침을 참조하십시오.

  2. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

제품 배터리가 너무 뜨겁습니다

제품 보관 컨트롤러의 배터리가 과열되었습니다.

  1. 이 노드에 영향을 주는 다른 경고가 있는지 확인합니다. 이 경고는 다른 경고를 해결할 때 해결될 수 있습니다.

  2. 팬 또는 HVAC 장애와 같은 온도 상승의 가능한 원인을 조사하십시오.

  3. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

어플라이언스 BMC 통신 오류입니다

베이스보드 관리 컨트롤러(BMC)와의 통신이 끊어졌습니다.

  1. BMC가 정상적으로 작동하는지 확인합니다. nodes * 를 선택한 다음 어플라이언스 노드의 * Hardware * 탭을 선택합니다. Compute Controller BMC IP 필드를 찾아 해당 IP로 이동합니다.

  2. 노드를 유지보수 모드로 전환한 다음 어플라이언스 전원을 껐다가 다시 켜서 BMC 통신을 복구해 보십시오. 사용 중인 제품의 지침을 참조하십시오.

  3. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

어플라이언스 캐시 백업 디바이스에 장애가 발생했습니다

영구 캐시 백업 디바이스가 실패했습니다.

  1. 이 노드에 영향을 주는 다른 경고가 있는지 확인합니다. 이 경고는 다른 경고를 해결할 때 해결될 수 있습니다.

  2. 기술 지원 부서에 문의하십시오.

어플라이언스 캐시 백업 디바이스의 용량이 부족합니다

캐시 백업 디바이스 용량이 부족합니다.

기술 지원 부서에 문의하십시오.

어플라이언스 캐시 백업 디바이스 쓰기 방지

캐시 백업 디바이스가 쓰기 금지되어 있습니다.

기술 지원 부서에 문의하십시오.

어플라이언스 캐시 메모리 크기가 일치하지 않습니다

어플라이언스의 두 컨트롤러는 캐시 크기가 다릅니다.

기술 지원 부서에 문의하십시오.

어플라이언스의 컴퓨팅 컨트롤러 섀시 온도가 너무 높습니다

StorageGRID 어플라이언스의 컴퓨팅 컨트롤러 온도가 공칭 임계값을 초과했습니다.

  1. 하드웨어 구성 요소의 과열 상태를 점검하고 권장 조치를 따르십시오.

    • SG100, SG1000 또는 SG6000을 사용하는 경우 BMC를 사용하십시오.

    • SG5600 또는 SG5700을 사용하는 경우 SANtricity 시스템 관리자를 사용하십시오.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

어플라이언스의 컴퓨팅 컨트롤러 CPU 온도가 너무 높습니다

StorageGRID 어플라이언스의 컴퓨팅 컨트롤러에 있는 CPU 온도가 공칭 임계값을 초과했습니다.

  1. 하드웨어 구성 요소의 과열 상태를 점검하고 권장 조치를 따르십시오.

    • SG100, SG1000 또는 SG6000을 사용하는 경우 BMC를 사용하십시오.

    • SG5600 또는 SG5700을 사용하는 경우 SANtricity 시스템 관리자를 사용하십시오.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

어플라이언스 컴퓨팅 컨트롤러에 주의가 필요합니다

StorageGRID 어플라이언스의 컴퓨팅 컨트롤러에서 하드웨어 장애가 감지되었습니다.

  1. 하드웨어 구성 요소에 오류가 있는지 확인하고 권장 조치를 따르십시오.

    • SG100, SG1000 또는 SG6000을 사용하는 경우 BMC를 사용하십시오.

    • SG5600 또는 SG5700을 사용하는 경우 SANtricity 시스템 관리자를 사용하십시오.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

어플라이언스 컴퓨팅 컨트롤러 전원 공급 장치 A에 문제가 있습니다

컴퓨팅 컨트롤러의 전원 공급 장치 A에 문제가 있습니다. 이 경고는 전원 공급 장치에 문제가 있거나 전원을 공급하는 데 문제가 있음을 나타낼 수 있습니다.

  1. 하드웨어 구성 요소에 오류가 있는지 확인하고 권장 조치를 따르십시오.

    • SG100, SG1000 또는 SG6000을 사용하는 경우 BMC를 사용하십시오.

    • SG5600 또는 SG5700을 사용하는 경우 SANtricity 시스템 관리자를 사용하십시오.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

어플라이언스 컴퓨팅 컨트롤러 전원 공급 장치 B에 문제가 있습니다

컴퓨팅 컨트롤러의 전원 공급 장치 B에 문제가 있습니다.

이 알림은 전원 공급 장치에 오류가 발생했거나 전원을 공급하는 데 문제가 있음을 나타낼 수 있습니다.

  1. 하드웨어 구성 요소에 오류가 있는지 확인하고 권장 조치를 따르십시오.

    • SG100, SG1000 또는 SG6000을 사용하는 경우 BMC를 사용하십시오.

    • SG5600 또는 SG5700을 사용하는 경우 SANtricity 시스템 관리자를 사용하십시오.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

어플라이언스 컴퓨팅 하드웨어 모니터 서비스가 중단되었습니다

스토리지 하드웨어 상태를 모니터링하는 서비스가 데이터 보고를 중지했습니다.

  1. Base-OS에서 eos-system-status 서비스의 상태를 확인한다.

  2. 서비스가 중지되었거나 오류 상태인 경우 서비스를 다시 시작합니다.

  3. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

어플라이언스 Fibre Channel 장애가 감지되었습니다

어플라이언스 스토리지 컨트롤러와 컴퓨팅 컨트롤러 간에 파이버 채널 링크 문제가 감지되었습니다.

이 알림은 어플라이언스에서 스토리지와 컴퓨팅 컨트롤러 간의 파이버 채널 연결에 문제가 있음을 나타낼 수 있습니다.

  1. 하드웨어 구성 요소에서 오류를 확인합니다(* nodes * > *appliance node * > * Hardware *). 구성 요소의 상태가 ""공칭""가 아닌 경우 다음 조치를 취하십시오.

    1. 컨트롤러 간 파이버 채널 케이블이 완전히 연결되어 있는지 확인합니다.

    2. Fibre Channel 케이블이 과도하게 구부러져 있지 않은지 확인합니다.

    3. SFP+ 모듈이 올바르게 장착되었는지 확인합니다.

      • 참고: * 이 문제가 지속되면 StorageGRID 시스템에서 문제가 있는 연결을 자동으로 오프라인 상태로 전환할 수 있습니다.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

어플라이언스 Fibre Channel HBA 포트 오류입니다

Fibre Channel HBA 포트에 장애가 발생했거나 장애가 발생했습니다.

기술 지원 부서에 문의하십시오.

어플라이언스 플래시 캐시 드라이브가 최적이 아닙니다

SSD 캐시에 사용되는 드라이브가 최적화되지 않았습니다.

  1. SSD 캐시 드라이브를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

  2. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

어플라이언스 상호 연결/배터리 캐니스터가 제거되었습니다

상호 연결/배터리 캐니스터가 없습니다.

  1. 배터리를 교체합니다. 전지 분리 및 교체 단계는 저장 컨트롤러 교체 절차에 포함되어 있습니다. 스토리지 어플라이언스 지침을 참조하십시오.

  2. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

어플라이언스 LACP 포트가 누락되었습니다

StorageGRID 어플라이언스의 포트가 LACP 결합에 사용되고 있지 않습니다.

  1. 스위치의 구성을 확인하십시오. 인터페이스가 올바른 Link Aggregation 그룹에 구성되어 있는지 확인합니다.

  2. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

어플라이언스의 전체 전원 공급 장치 성능이 저하되었습니다

StorageGRID 제품의 전원이 권장 작동 전압을 벗어나 있습니다.

  1. 전원 공급 장치 A 및 B의 상태를 점검하여 어떤 전원 공급 장치가 비정상적으로 작동하는지 확인하고 권장 조치를 따르십시오.

    • SG100, SG1000 또는 SG6000을 사용하는 경우 BMC를 사용하십시오.

    • SG5600 또는 SG5700을 사용하는 경우 SANtricity 시스템 관리자를 사용하십시오.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

어플라이언스 스토리지 컨트롤러 A에 장애가 발생했습니다

StorageGRID 어플라이언스의 스토리지 컨트롤러 A에 장애가 발생했습니다.

  1. SANtricity 시스템 관리자를 사용하여 하드웨어 구성 요소를 확인하고 권장 조치를 수행하십시오.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

어플라이언스 스토리지 컨트롤러 B에 장애가 발생했습니다

StorageGRID 어플라이언스의 스토리지 컨트롤러 B에 장애가 발생했습니다.

  1. SANtricity 시스템 관리자를 사용하여 하드웨어 구성 요소를 확인하고 권장 조치를 수행하십시오.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

어플라이언스 스토리지 컨트롤러 드라이브 오류입니다

StorageGRID 어플라이언스에 있는 하나 이상의 드라이브가 실패했거나 최적이 아닙니다.

  1. SANtricity 시스템 관리자를 사용하여 하드웨어 구성 요소를 확인하고 권장 조치를 수행하십시오.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

어플라이언스 스토리지 컨트롤러 하드웨어 문제입니다

SANtricity 소프트웨어가 StorageGRID 어플라이언스의 구성 요소에 대해 "주의 필요"를 보고하고 있습니다.

  1. SANtricity 시스템 관리자를 사용하여 하드웨어 구성 요소를 확인하고 권장 조치를 수행하십시오.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

어플라이언스 스토리지 컨트롤러 전원 공급 장치 A 고장

StorageGRID 제품의 전원 공급 장치 A가 권장 작동 전압을 벗어나고 있습니다.

  1. SANtricity 시스템 관리자를 사용하여 하드웨어 구성 요소를 확인하고 권장 조치를 수행하십시오.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

어플라이언스 스토리지 컨트롤러 전원 공급 장치 B 오류입니다

StorageGRID 제품의 전원 공급 장치 B가 권장 작동 전압을 벗어나 있습니다.

  1. SANtricity 시스템 관리자를 사용하여 하드웨어 구성 요소를 확인하고 권장 조치를 수행하십시오.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

어플라이언스 스토리지 하드웨어 모니터 서비스가 중단되었습니다

스토리지 하드웨어 상태를 모니터링하는 서비스가 데이터 보고를 중지했습니다.

  1. Base-OS에서 eos-system-status 서비스의 상태를 확인한다.

  2. 서비스가 중지되었거나 오류 상태인 경우 서비스를 다시 시작합니다.

  3. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

어플라이언스 스토리지 쉘프 성능이 저하되었습니다

스토리지 어플라이언스의 스토리지 쉘프에 있는 구성 요소 중 하나의 상태가 성능 저하입니다.

  1. SANtricity 시스템 관리자를 사용하여 하드웨어 구성 요소를 확인하고 권장 조치를 수행하십시오.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

제품 온도가 초과되었습니다

제품 보관 컨트롤러의 공칭 또는 최대 온도를 초과했습니다.

  1. 이 노드에 영향을 주는 다른 경고가 있는지 확인합니다. 이 경고는 다른 경고를 해결할 때 해결될 수 있습니다.

  2. 팬 또는 HVAC 장애와 같은 온도 상승의 가능한 원인을 조사하십시오.

  3. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

제품 온도 센서가 제거되었습니다

온도 센서가 제거되었습니다. 기술 지원 부서에 문의하십시오.

Cassandra 자동 콤팩터 오류입니다

Cassandra 자동 콤팩터에 오류가 발생했습니다.

Cassandra 자동 압축 프로그램은 모든 스토리지 노드에 있으며, 과도한 워크로드를 덮어쓰기 및 삭제할 수 있도록 Cassandra 데이터베이스 크기를 관리합니다. 이 상태가 지속되는 동안 특정 워크로드에서 예기치 않게 높은 메타데이터 소비가 발생합니다.

  1. 이 노드에 영향을 주는 다른 경고가 있는지 확인합니다. 이 경고는 다른 경고를 해결할 때 해결될 수 있습니다.

  2. 기술 지원 부서에 문의하십시오.

감사 로그가 인메모리 대기열에 추가되고 있습니다

노드가 로컬 syslog 서버로 로그를 전송할 수 없고 인메모리 큐가 가득 찬 경우

  1. rsyslog 서비스가 노드에서 실행되고 있는지 확인합니다.

  2. 필요한 경우 'service rsyslog restart' 명령을 사용하여 노드에서 rsyslog 서비스를 다시 시작합니다.

  3. rsyslog 서비스를 다시 시작할 수 없고 감사 메시지를 관리 노드에 저장하지 않은 경우 기술 지원 부서에 문의하십시오. 이 상태가 수정되지 않으면 감사 로그가 손실됩니다.

Cassandra 자동 콤팩터 메트릭이 최신 상태가 아닙니다

Cassandra 자동 콤팩터를 설명하는 메트릭이 최신 상태가 아닙니다.

Cassandra 자동 압축 프로그램은 모든 스토리지 노드에 있으며, 과도한 워크로드를 덮어쓰기 및 삭제할 수 있도록 Cassandra 데이터베이스 크기를 관리합니다. 이 알림이 지속되는 동안 특정 워크로드에서 예기치 않게 높은 메타데이터 소비가 발생합니다.

  1. 이 노드에 영향을 주는 다른 경고가 있는지 확인합니다. 이 경고는 다른 경고를 해결할 때 해결될 수 있습니다.

  2. 기술 지원 부서에 문의하십시오.

Cassandra 통신 오류입니다

Cassandra 서비스를 실행하는 노드는 서로 통신하는 데 문제가 있습니다.

이 알림은 노드 간 통신을 방해하는 것이 있음을 나타냅니다. 네트워크 문제가 있거나 하나 이상의 스토리지 노드에서 Cassandra 서비스가 다운되었을 수 있습니다.

  1. 하나 이상의 스토리지 노드에 영향을 주는 다른 경고가 있는지 확인합니다. 이 경고는 다른 경고를 해결할 때 해결될 수 있습니다.

  2. 하나 이상의 스토리지 노드에 영향을 줄 수 있는 네트워크 문제를 확인합니다.

  3. 지원 * > * 도구 * > * 그리드 토폴로지 * 를 선택합니다.

  4. 시스템의 각 스토리지 노드에 대해 * SSM * > * Services * 를 선택합니다. Cassandra 서비스의 상태가 "실행 중"인지 확인합니다.

  5. Cassandra가 실행되고 있지 않으면 의 단계를 따릅니다 서비스를 시작하거나 다시 시작하는 중입니다.

  6. Cassandra 서비스의 모든 인스턴스가 실행되고 있고 경고가 해결되지 않으면 기술 지원 부서에 문의하십시오.

Cassandra 압축 과부하입니다

Cassandra 컴팩션 프로세스가 과부하 상태입니다.

컴팩션 프로세스가 과부하되면 읽기 성능이 저하되고 RAM이 사용될 수 있습니다. Cassandra 서비스가 응답하지 않거나 충돌될 수도 있습니다.

  1. 에 대한 단계를 수행하여 Cassandra 서비스를 다시 시작합니다 서비스를 다시 시작하는 중입니다.

  2. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

Cassandra 복구 메트릭이 최신 상태가 아닙니다

Cassandra 복구 작업을 설명하는 메트릭이 최신 상태가 아닙니다. 이 조건이 48시간 이상 지속되는 경우 버킷 리스팅과 같은 클라이언트 쿼리에 삭제된 데이터가 표시될 수 있습니다.

  1. 노드를 재부팅합니다. Grid Manager에서 * nodes * 로 이동하여 노드를 선택하고 Tasks 탭을 선택합니다.

  2. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

Cassandra 복구 진행률이 느립니다

Cassandra 데이터베이스 복구 진행률이 느립니다.

데이터베이스 복구 속도가 느리면 Cassandra 데이터 일관성 작업이 지연됩니다. 이 조건이 48시간 이상 지속되는 경우 버킷 리스팅과 같은 클라이언트 쿼리에 삭제된 데이터가 표시될 수 있습니다.

  1. 모든 스토리지 노드가 온라인 상태이고 네트워킹 관련 경고가 없는지 확인합니다.

  2. 이 경고를 최대 2일간 모니터링하여 문제가 자체적으로 해결되는지 확인합니다.

  3. 데이터베이스 복구가 계속 느리게 진행될 경우 기술 지원 부서에 문의하십시오.

Cassandra 복구 서비스를 사용할 수 없습니다

Cassandra 복구 서비스를 사용할 수 없습니다.

Cassandra 복구 서비스는 모든 스토리지 노드에 있으며 Cassandra 데이터베이스에 대한 중요 복구 기능을 제공합니다. 이 조건이 48시간 이상 지속되는 경우 버킷 리스팅과 같은 클라이언트 쿼리에 삭제된 데이터가 표시될 수 있습니다.

  1. 지원 * > * 도구 * > * 그리드 토폴로지 * 를 선택합니다.

  2. 시스템의 각 스토리지 노드에 대해 * SSM * > * Services * 를 선택합니다. Cassandra Refaper 서비스의 상태가 "Running"인지 확인합니다.

  3. Cassandra Reaper가 실행되고 있지 않으면 의 단계를 따릅니다 서비스를 시작하거나 다시 시작하는 중입니다.

  4. Cassandra Refaper 서비스의 모든 인스턴스가 실행 중이고 경고가 해결되지 않으면 기술 지원 부서에 문의하십시오.

Cassandra 테이블 손상

Cassandra가 테이블 손상을 감지했습니다.

테이블 손상이 감지되면 Cassandra가 자동으로 다시 시작됩니다.

기술 지원 부서에 문의하십시오.

클라우드 스토리지 풀 연결 오류입니다

클라우드 스토리지 풀의 상태 점검에서 하나 이상의 새 오류가 감지되었습니다.

  1. 스토리지 풀 페이지의 클라우드 스토리지 풀 섹션으로 이동합니다.

  2. 마지막 오류 열을 확인하여 오류가 있는 클라우드 스토리지 풀을 확인합니다.

  3. 의 지침을 참조하십시오 정보 수명 주기 관리로 개체 관리.

DHCP 리스가 만료되었습니다

네트워크 인터페이스의 DHCP 리스가 만료되었습니다. DHCP 리스가 만료된 경우 권장 조치를 따르십시오.

  1. 영향을 받는 인터페이스에서 이 노드와 DHCP 서버 사이에 연결이 있는지 확인합니다.

  2. DHCP 서버의 영향을 받는 서브넷에 할당할 수 있는 IP 주소가 있는지 확인합니다.

  3. DHCP 서버에 구성된 IP 주소에 대한 영구 예약이 있는지 확인합니다. 또는 StorageGRID IP 변경 도구를 사용하여 DHCP 주소 풀 외부에서 고정 IP 주소를 할당합니다. 를 참조하십시오 복구 및 유지 관리 지침.

DHCP 임대가 곧 만료됩니다

네트워크 인터페이스의 DHCP 임대가 곧 만료됩니다.

DHCP 임대가 만료되지 않도록 하려면 권장 조치를 따르십시오.

  1. 영향을 받는 인터페이스에서 이 노드와 DHCP 서버 사이에 연결이 있는지 확인합니다.

  2. DHCP 서버의 영향을 받는 서브넷에 할당할 수 있는 IP 주소가 있는지 확인합니다.

  3. DHCP 서버에 구성된 IP 주소에 대한 영구 예약이 있는지 확인합니다. 또는 StorageGRID IP 변경 도구를 사용하여 DHCP 주소 풀 외부에서 고정 IP 주소를 할당합니다. 를 참조하십시오 복구 및 유지 관리 지침.

DHCP 서버를 사용할 수 없습니다

DHCP 서버를 사용할 수 없습니다.

StorageGRID 노드가 DHCP 서버에 연결할 수 없습니다. 노드의 IP 주소에 대한 DHCP 리스를 확인할 수 없습니다.

  1. 영향을 받는 인터페이스에서 이 노드와 DHCP 서버 사이에 연결이 있는지 확인합니다.

  2. DHCP 서버의 영향을 받는 서브넷에 할당할 수 있는 IP 주소가 있는지 확인합니다.

  3. DHCP 서버에 구성된 IP 주소에 대한 영구 예약이 있는지 확인합니다. 또는 StorageGRID IP 변경 도구를 사용하여 DHCP 주소 풀 외부에서 고정 IP 주소를 할당합니다. 를 참조하십시오 복구 및 유지 관리 지침.

디스크 I/O가 매우 느립니다

매우 느린 디스크 I/O는 StorageGRID 성능에 영향을 미칠 수 있습니다.

  1. 문제가 스토리지 어플라이언스 노드와 관련된 경우 SANtricity System Manager를 사용하여 드라이브 오류, 예상 오류가 있는 드라이브 또는 진행 중인 드라이브 수리를 확인합니다. 또한 어플라이언스 컴퓨팅 및 스토리지 컨트롤러 간의 파이버 채널 또는 SAS 링크 상태를 확인하여 링크가 다운되었는지 또는 과도한 오류 비율을 표시하는지 확인합니다.

  2. 이 노드의 볼륨을 호스팅하는 스토리지 시스템을 검사하여 느린 I/O의 근본 원인을 확인하고 수정합니다

  3. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

    • 참고: * 영향 받는 노드는 서비스를 사용하지 않도록 설정하고 자체적으로 재부팅하여 전체 그리드 성능에 영향을 미치지 않도록 할 수 있습니다. 기본 상태가 해제되고 이러한 노드가 정상적인 I/O 성능을 감지하면 전체 서비스로 자동으로 돌아갑니다.

EC 재조정 실패

스토리지 노드 간에 삭제 코딩 데이터의 균형을 재조정하는 작업이 실패했거나 사용자가 일시 중지했습니다.

  1. 재조정되는 사이트의 모든 스토리지 노드가 온라인 상태이고 사용 가능한지 확인합니다.

  2. 재조정된 사이트에서 볼륨 장애가 발생하지 않도록 하십시오. 복구 작업을 실행할 수 있도록 EC 재조정 작업이 있는 경우 작업을 종료합니다.

    ''밸런스-데이터 종료—​작업 ID<ID>'

  3. 재조정되고 있는 사이트에서 서비스 오류가 없는지 확인합니다. 서비스가 실행되고 있지 않으면 복구 및 유지 관리 지침의 서비스 시작 또는 재시작 단계를 따르십시오.

  4. 문제를 해결한 후 기본 관리 노드에서 다음 명령을 실행하여 작업을 다시 시작합니다.

    `’re balance-data start—​job-id<ID>'

  5. 문제를 해결할 수 없는 경우 기술 지원 부서에 문의하십시오.

EC 복구 실패

삭제 코딩 데이터에 대한 복구 작업이 실패했거나 중지되었습니다.

  1. 장애가 발생한 스토리지 노드 또는 볼륨을 대신 사용할 수 있는 스토리지 노드 또는 볼륨이 있는지 확인합니다.

  2. 활성 ILM 정책을 충족할 수 있는 충분한 스토리지 노드가 있는지 확인합니다.

  3. 네트워크 연결 문제가 없는지 확인합니다.

  4. 문제를 해결한 후 기본 관리 노드에서 다음 명령을 실행하여 작업을 다시 시작합니다.

    ``repair-data start-ec-node-repair—​repair-id<ID>'

  5. 문제를 해결할 수 없는 경우 기술 지원 부서에 문의하십시오.

EC 복구가 중단되었습니다

삭제 코딩 데이터에 대한 복구 작업이 중단되었습니다.

  1. 장애가 발생한 스토리지 노드 또는 볼륨을 대신 사용할 수 있는 스토리지 노드 또는 볼륨이 있는지 확인합니다.

  2. 네트워크 연결 문제가 없는지 확인합니다.

  3. 문제를 해결한 후 경고가 해결되었는지 확인합니다. 복구 진행 상황에 대한 자세한 보고서를 보려면 기본 관리 노드에서 다음 명령을 실행합니다.

    ``repair-data show-ec-repair-status—​repair-id<ID>'

  4. 문제를 해결할 수 없는 경우 기술 지원 부서에 문의하십시오.

이메일 알림 실패

알림에 대한 이메일 알림을 보낼 수 없습니다.

이 알림은 알림 e-메일 알림이 실패하거나 테스트 e-메일(* alerts*>* Email setup* 페이지에서 보냄)을 전달할 수 없을 때 트리거됩니다.

  1. 경고의 * 사이트/노드 * 열에 나열된 관리 노드에서 그리드 관리자에 로그인합니다.

  2. 알림 * > * 이메일 설정 * 페이지로 이동하여 설정을 확인하고 필요한 경우 변경하십시오.

  3. 테스트 이메일 보내기 * 를 클릭하고 테스트 수신자의 받은 편지함에서 이메일을 확인합니다. 테스트 이메일을 보낼 수 없는 경우 이 경고의 새 인스턴스가 트리거될 수 있습니다.

  4. 테스트 이메일을 보낼 수 없는 경우 이메일 서버가 온라인 상태인지 확인합니다.

  5. 서버가 작동하는 경우 * 지원 * > * 도구 * > * 로그 * 를 선택하고 관리 노드에 대한 로그를 수집합니다. 경고 시간 15분 전후의 기간을 지정합니다.

  6. 다운로드한 아카이브를 추출하고 'Prometheus.log'(_/GID<gid><time_stamp>/<site_node>/<time_stamp>/metrics/Prometheus.log)의 내용을 검토합니다.

  7. 문제를 해결할 수 없는 경우 기술 지원 부서에 문의하십시오.

인증서 페이지에 구성된 클라이언트 인증서 만료

인증서 페이지에 구성된 하나 이상의 클라이언트 인증서가 곧 만료됩니다.

  1. 그리드 관리자에서 * 구성 * > * 보안 * > * 인증서 * 를 선택한 다음 * 클라이언트 * 탭을 선택합니다.

  2. 곧 만료될 인증서를 선택합니다.

  3. 새 인증서 첨부 * 를 선택합니다 새 인증서를 업로드하거나 생성합니다.

  4. 곧 만료되는 각 인증서에 대해 이 단계를 반복합니다.

로드 밸런서 끝점 인증서 만료

하나 이상의 로드 밸런서 끝점 인증서가 곧 만료됩니다.

  1. 구성 * > * 네트워크 * > * 로드 밸런서 엔드포인트 * 를 선택합니다.

  2. 곧 만료될 인증서가 있는 끝점을 선택합니다.

  3. 새 인증서를 업로드하거나 생성하려면 * 끝점 편집 * 을 선택합니다.

  4. 인증서가 만료되었거나 곧 만료될 각 끝점에 대해 이 단계를 반복합니다.

로드 밸런서 끝점 관리에 대한 자세한 내용은 을 참조하십시오 StorageGRID 관리 지침.

관리 인터페이스에 대한 서버 인증서 만료

관리 인터페이스에 사용되는 서버 인증서가 곧 만료됩니다.

  1. 구성 * > * 보안 * > * 인증서 * 를 선택합니다.

  2. 글로벌 * 탭에서 * 관리 인터페이스 인증서 * 를 선택합니다.

  3. 새 관리 인터페이스 인증서를 업로드합니다.

S3 및 Swift API에 대한 글로벌 서버 인증서 만료

스토리지 API 엔드포인트를 액세스하는 데 사용되는 서버 인증서가 곧 만료됩니다.

  1. 구성 * > * 보안 * > * 인증서 * 를 선택합니다.

  2. 글로벌 * 탭에서 * S3 및 Swift API 인증서 * 를 선택합니다.

  3. 새 S3 및 Swift API 인증서를 업로드합니다.

외부 syslog CA 인증서 만료

외부 syslog 서버 인증서에 서명하는 데 사용되는 CA(인증 기관) 인증서가 곧 만료됩니다.

  1. 외부 syslog 서버의 CA 인증서를 업데이트합니다.

  2. 업데이트된 CA 인증서의 복사본을 가져옵니다.

  3. Grid Manager에서 * 구성 * > * 모니터링 * > * 감사 및 syslog 서버 * 로 이동합니다.

  4. Edit external syslog server * 를 선택합니다.

  5. 새 인증서를 업로드하려면 * 찾아보기 * 를 선택합니다.

  6. 구성 마법사를 완료하여 새 인증서와 키를 저장합니다.

외부 syslog 클라이언트 인증서 만료

외부 syslog 서버에 대한 클라이언트 인증서가 곧 만료됩니다.

  1. Grid Manager에서 * 구성 * > * 모니터링 * > * 감사 및 syslog 서버 * 로 이동합니다.

  2. Edit external syslog server * 를 선택합니다.

  3. 새 인증서를 업로드하려면 * 찾아보기 * 를 선택합니다.

  4. 새 개인 키를 업로드하려면 * 찾아보기 * 를 선택합니다.

  5. 구성 마법사를 완료하여 새 인증서와 키를 저장합니다.

외부 syslog 서버 인증서 만료

외부 syslog 서버가 제공하는 서버 인증서가 곧 만료됩니다.

  1. 외부 syslog 서버의 서버 인증서를 업데이트합니다.

  2. 이전에 Grid Manager API를 사용하여 인증서 유효성 검사를 위한 서버 인증서를 제공한 경우 API를 사용하여 업데이트된 서버 인증서를 업로드합니다.

외부 syslog 서버 전달 오류입니다

노드가 외부 syslog 서버로 로그를 전달할 수 없습니다.

  1. Grid Manager에서 * 구성 * > * 모니터링 * > * 감사 및 syslog 서버 * 로 이동합니다.

  2. Edit external syslog server * 를 선택합니다.

  3. 테스트 메시지 보내기 * 를 선택할 수 있을 때까지 구성 마법사를 진행합니다.

  4. 외부 syslog 서버로 로그를 전달할 수 없는 이유를 확인하려면 * 테스트 메시지 전송 * 을 선택합니다.

  5. 보고된 모든 문제를 해결합니다.

그리드 네트워크 MTU가 일치하지 않습니다

그리드 네트워크 인터페이스(eth0)에 대한 MTU(Maximum Transmission Unit) 설정은 그리드의 노드 간에 상당히 다릅니다.

MTU 설정의 차이는 일부(전기는 아님) eth0 네트워크가 점보 프레임에 맞게 구성되었다는 것을 나타낼 수 있습니다. MTU 크기가 1000보다 크면 네트워크 성능 문제가 발생할 수 있습니다.

에서 Grid Network MTU mismatch 알림에 대한 지침을 참조하십시오 네트워크, 하드웨어 및 플랫폼 문제를 해결합니다.

높은 Java 힙 사용

Java 힙 공간의 높은 비율이 사용되고 있습니다.

Java 힙이 가득 차면 메타데이터 서비스를 사용할 수 없게 되고 클라이언트 요청이 실패할 수 있습니다.

  1. 대시보드에서 ILM 활동을 검토합니다. ILM 워크로드가 감소하면 이 알림이 단독으로 해결될 수 있습니다.

  2. 이 노드에 영향을 주는 다른 경고가 있는지 확인합니다. 이 경고는 다른 경고를 해결할 때 해결될 수 있습니다.

  3. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

메타데이터 쿼리를 위한 높은 지연 시간

Cassandra 메타데이터 쿼리의 평균 시간이 너무 깁니다.

쿼리 대기 시간의 증가는 디스크 교체, 갑작스런 잉조수 증가 등의 워크로드 변경, 노드와 사이트 간 통신 문제 등의 네트워크 변경 등으로 인해 발생할 수 있습니다.

  1. 쿼리 대기 시간이 증가하는 시간 동안 하드웨어, 워크로드 또는 네트워크가 변경되었는지 확인합니다.

  2. 문제를 해결할 수 없는 경우 기술 지원 부서에 문의하십시오.

ID 페더레이션 동기화 실패

ID 소스에서 페더레이션 그룹과 사용자를 동기화할 수 없습니다.

  1. 구성된 LDAP 서버가 온라인 상태이고 사용 가능한지 확인합니다.

  2. ID 페더레이션 페이지에서 설정을 검토합니다. 모든 값이 최신인지 확인합니다. 을 참조하십시오 ID 페더레이션을 사용합니다 StorageGRID 관리 지침

  3. Test Connection * 을 클릭하여 LDAP 서버 설정을 확인합니다.

  4. 문제를 해결할 수 없는 경우 기술 지원 부서에 문의하십시오.

테넌트의 ID 페더레이션 동기화 실패

테넌트가 구성한 ID 소스에서 페더레이션 그룹과 사용자를 동기화할 수 없습니다.

  1. 테넌트 관리자에 로그인합니다.

  2. 테넌트가 구성한 LDAP 서버가 온라인 상태이고 사용 가능한지 확인합니다.

  3. ID 페더레이션 페이지에서 설정을 검토합니다. 모든 값이 최신인지 확인합니다. 을 참조하십시오 ID 페더레이션을 사용합니다 테넌트 계정 사용 지침

  4. Test Connection * 을 클릭하여 LDAP 서버 설정을 확인합니다.

  5. 문제를 해결할 수 없는 경우 기술 지원 부서에 문의하십시오.

ILM 배치를 달성 할 수 없습니다

ILM 규칙의 배치 지침은 특정 개체에 대해 달성할 수 없습니다.

이 알림은 배치 명령에 필요한 노드를 사용할 수 없거나 ILM 규칙이 잘못 구성되었음을 나타냅니다. 예를 들어 규칙이 스토리지 노드보다 더 많은 복제 복사본을 지정할 수 있습니다.

  1. 모든 노드가 온라인 상태인지 확인합니다.

  2. 모든 노드가 온라인 상태인 경우 활성 ILM 정책을 사용하는 모든 ILM 규칙의 배치 지침을 검토하십시오. 모든 개체에 대한 올바른 지침이 있는지 확인합니다. 를 참조하십시오 정보 수명 주기 관리를 사용하여 개체를 관리하기 위한 지침.

  3. 필요에 따라 규칙 설정을 업데이트하고 새 정책을 활성화합니다.

    • 참고: * 알림이 지워지려면 최대 1일이 걸릴 수 있습니다.

  4. 문제가 지속되면 기술 지원 팀에 문의하십시오.

    • 참고: * 이 알림은 업그레이드 중에 나타날 수 있으며 업그레이드가 성공적으로 완료된 후 1일 동안 지속될 수 있습니다. 업그레이드로 인해 이 알림이 트리거되면 알림이 자체적으로 삭제됩니다.

ILM 스캔 기간이 너무 깁니다

ILM을 스캔, 평가 및 적용하는 데 필요한 시간이 너무 깁니다.

모든 개체에 대한 전체 ILM 스캔을 완료하는 데 걸리는 예상 시간이 너무 긴 경우(* 대시보드의 * 스캔 기간 - 예상 * 참조) 활성 ILM 정책이 새로 수집된 개체에 적용되지 않을 수 있습니다. ILM 정책 변경 사항이 기존 개체에 적용되지 않을 수 있습니다.

  1. 이 노드에 영향을 주는 다른 경고가 있는지 확인합니다. 이 경고는 다른 경고를 해결할 때 해결될 수 있습니다.

  2. 모든 스토리지 노드가 온라인 상태인지 확인합니다.

  3. 클라이언트 트래픽의 양을 일시적으로 줄입니다. 예를 들어 그리드 관리자에서 * 구성 * > * 네트워크 * > * 트래픽 분류 * 를 선택하고 대역폭 또는 요청 수를 제한하는 정책을 만듭니다.

  4. 디스크 I/O 또는 CPU가 과부하 상태인 경우 로드를 줄이거나 리소스를 늘리십시오.

  5. 필요한 경우 ILM 규칙을 업데이트하여 동기 배치(StorageGRID 11.3 이후에 생성된 규칙의 기본값)를 사용합니다.

  6. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

ILM 스캔 속도가 낮습니다

ILM 스캔 속도는 초당 100개 미만으로 설정됩니다.

이 알림은 시스템의 ILM 스캔 속도를 초당 100개 미만으로 변경했음을 나타냅니다(기본값: 400개 개체/초). 활성 ILM 정책이 새로 수집된 개체에 적용되지 않을 수 있습니다. ILM 정책에 대한 이후의 변경 사항은 기존 개체에 적용되지 않습니다.

  1. 지속적인 지원 조사의 일환으로 ILM 스캔 속도가 일시적으로 변경되었는지 확인합니다.

  2. 기술 지원 부서에 문의하십시오.

중요 기술 지원 부서에 문의하지 않고 ILM 스캔 속도를 변경하지 마십시오.

KMS CA 인증서 만료

KMS(키 관리 서버) 인증서에 서명하는 데 사용되는 CA(인증 기관) 인증서가 곧 만료됩니다.

  1. KMS 소프트웨어를 사용하여 키 관리 서버에 대한 CA 인증서를 업데이트합니다.

  2. Grid Manager에서 * 구성 * > * 보안 * > * 키 관리 서버 * 를 선택합니다.

  3. 인증서 상태 경고가 있는 KMS를 선택합니다.

  4. 편집 * 을 선택합니다.

  5. 2단계(서버 인증서 업로드)로 이동하려면 * 다음 * 을 선택합니다.

  6. 새 인증서를 업로드하려면 * 찾아보기 * 를 선택합니다.

  7. 저장 * 을 선택합니다.

KMS 클라이언트 인증서 만료

키 관리 서버의 클라이언트 인증서가 곧 만료됩니다.

  1. Grid Manager에서 * 구성 * > * 보안 * > * 키 관리 서버 * 를 선택합니다.

  2. 인증서 상태 경고가 있는 KMS를 선택합니다.

  3. 편집 * 을 선택합니다.

  4. 다음 * 을 선택하여 3단계(클라이언트 인증서 업로드)로 이동합니다.

  5. 새 인증서를 업로드하려면 * 찾아보기 * 를 선택합니다.

  6. 새 개인 키를 업로드하려면 * 찾아보기 * 를 선택합니다.

  7. 저장 * 을 선택합니다.

KMS 구성을 로드하지 못했습니다

키 관리 서버에 대한 구성이 있지만 로드하지 못했습니다.

  1. 이 노드에 영향을 주는 다른 경고가 있는지 확인합니다. 이 경고는 다른 경고를 해결할 때 해결될 수 있습니다.

  2. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

KMS 연결 오류입니다

어플라이언스 노드가 사이트의 키 관리 서버에 연결할 수 없습니다.

  1. Grid Manager에서 * 구성 * > * 보안 * > * 키 관리 서버 * 를 선택합니다.

  2. 포트 및 호스트 이름 항목이 올바른지 확인합니다.

  3. 서버 인증서, 클라이언트 인증서 및 클라이언트 인증서 개인 키가 올바르고 만료되지 않았는지 확인합니다.

  4. 어플라이언스 노드가 지정된 KMS와 통신할 수 있도록 방화벽 설정이 허용되는지 확인합니다.

  5. 네트워킹 또는 DNS 문제를 모두 해결합니다.

  6. 도움이 필요하거나 이 경고가 계속 표시되면 기술 지원 팀에 문의하십시오.

KMS 암호화 키 이름을 찾을 수 없습니다

구성된 키 관리 서버에 제공된 이름과 일치하는 암호화 키가 없습니다.

  1. 사이트에 할당된 KMS가 암호화 키 및 이전 버전에 대해 올바른 이름을 사용하고 있는지 확인합니다.

  2. 도움이 필요하거나 이 경고가 계속 표시되면 기술 지원 팀에 문의하십시오.

KMS 암호화 키 회전이 실패했습니다

모든 어플라이언스 볼륨이 해독되었지만 하나 이상의 볼륨이 최신 키로 회전할 수 없습니다. 기술 지원 부서에 문의하십시오.

KMS가 구성되지 않았습니다

이 사이트에 대한 키 관리 서버가 없습니다.

  1. Grid Manager에서 * 구성 * > * 보안 * > * 키 관리 서버 * 를 선택합니다.

  2. 이 사이트에 대해 KMS를 추가하거나 기본 KMS를 추가합니다.

킬로미터 키가 어플라이언스 볼륨을 해독하지 못했습니다

노드 암호화가 활성화된 어플라이언스에서 하나 이상의 볼륨을 현재 KMS 키로 해독할 수 없습니다.

  1. 이 노드에 영향을 주는 다른 경고가 있는지 확인합니다. 이 경고는 다른 경고를 해결할 때 해결될 수 있습니다.

  2. KMS(키 관리 서버)에 암호화 키 및 이전 키 버전이 구성되어 있는지 확인합니다.

  3. 도움이 필요하거나 이 경고가 계속 표시되면 기술 지원 팀에 문의하십시오.

KMS 서버 인증서 만료

KMS(키 관리 서버)에서 사용하는 서버 인증서가 곧 만료됩니다.

  1. KMS 소프트웨어를 사용하여 키 관리 서버에 대한 서버 인증서를 업데이트합니다.

  2. 도움이 필요하거나 이 경고가 계속 표시되면 기술 지원 팀에 문의하십시오.

대규모 감사 대기열

감사 메시지의 디스크 대기열이 가득 찼습니다.

  1. 시스템의 로드 점검 — 트랜잭션 수가 상당히 많은 경우 시간이 지남에 따라 경고가 자동으로 해결되고 경고를 무시할 수 있습니다.

  2. 경고가 지속되고 심각도가 증가하면 대기열 크기의 차트를 참조하십시오. 시간이 경과하거나 며칠 동안 꾸준히 증가하는 경우 감사 로드가 시스템의 감사 용량을 초과할 가능성이 높습니다.

  3. 클라이언트 쓰기 및 클라이언트 읽기에 대한 감사 수준을 오류 또는 끄기로 변경하여 클라이언트 작업 속도를 줄이거나 기록된 감사 메시지 수를 줄이십시오(* 구성 * > * 모니터링 * > * 감사 및 syslog 서버 *).

레거시 CLB 로드 밸런서 활동이 감지되었습니다

일부 클라이언트는 기본 S3 및 Swift API 인증서를 사용하여 더 이상 사용되지 않는 CLB 로드 밸런서 서비스에 연결할 수 있습니다.

  1. 향후 업그레이드를 간소화하려면 * 인증서 * 페이지의 * 글로벌 * 탭에 사용자 정의 S3 및 Swift API 인증서를 설치하십시오. 그런 다음 레거시 CLB에 연결하는 모든 S3 또는 Swift 클라이언트에 새 인증서가 있는지 확인합니다.

  2. 하나 이상의 로드 밸런서 끝점을 만듭니다. 그런 다음 기존의 모든 S3 및 Swift 클라이언트를 이러한 엔드포인트로 연결합니다. 클라이언트 포트를 다시 매핑해야 하는 경우 기술 지원 부서에 문의하십시오.

포트 스캔을 비롯한 다른 작업으로 인해 이 경고가 발생할 수 있습니다. 더 이상 사용되지 않는 CLB 서비스가 현재 사용 중인지 확인하려면 'toragegrid_private_clb_http_connection_설정됨_successful' Prometheus 메트릭을 참조하십시오.

CLB 서비스를 더 이상 사용하지 않는 경우 필요에 따라 이 경고 규칙을 해제하거나 비활성화하십시오.

로그가 디스크 대기열에 추가되고 있습니다

노드가 외부 syslog 서버로 로그를 전달할 수 없고 디스크 내 대기열이 가득 찬 경우

  1. Grid Manager에서 * 구성 * > * 모니터링 * > * 감사 및 syslog 서버 * 로 이동합니다.

  2. Edit external syslog server * 를 선택합니다.

  3. 테스트 메시지 보내기 * 를 선택할 수 있을 때까지 구성 마법사를 진행합니다.

  4. 외부 syslog 서버로 로그를 전달할 수 없는 이유를 확인하려면 * 테스트 메시지 전송 * 을 선택합니다.

  5. 보고된 모든 문제를 해결합니다.

감사 로그 디스크 용량이 낮습니다

감사 로그에 사용할 수 있는 공간이 부족합니다.

  1. 이 경고를 모니터링하여 문제가 자체적으로 해결되고 디스크 공간을 다시 사용할 수 있는지 확인합니다.

  2. 사용 가능한 공간이 계속 줄어지면 기술 지원 부서에 문의하십시오.

사용 가능한 노드 메모리가 부족합니다

노드에서 사용할 수 있는 RAM 용량이 부족합니다.

사용 가능한 RAM이 낮으면 작업 부하가 변경되거나 하나 이상의 노드에서 메모리 누수가 발생한 것일 수 있습니다.

  1. 이 경고를 모니터링하여 문제가 자체적으로 해결되는지 확인합니다.

  2. 사용 가능한 메모리가 주요 경고 임계값 아래로 떨어지면 기술 지원 부서에 문의하십시오.

스토리지 풀의 사용 가능한 공간이 부족합니다

스토리지 풀에 오브젝트 데이터를 저장하는 데 사용할 수 있는 공간이 부족합니다.

  1. ILM * > * 스토리지 풀 * 을 선택합니다.

  2. 알림에 나열된 스토리지 풀을 선택하고 * View details * 를 선택합니다.

  3. 추가 스토리지 용량이 필요한 위치를 확인합니다. 스토리지 풀의 각 사이트에 스토리지 노드를 추가하거나 하나 이상의 기존 스토리지 노드에 스토리지 볼륨(LUN)을 추가할 수 있습니다.

  4. 스토리지 용량을 늘리려면 확장 절차를 수행하십시오.

설치된 노드 메모리가 부족합니다

노드에 설치된 메모리 양이 부족합니다.

가상 머신 또는 Linux 호스트에서 사용할 수 있는 RAM의 양을 늘립니다. StorageGRID 노드의 기본 최소 요구 사항을 확인하려면 주 경고의 임계값을 확인합니다. 플랫폼에 대한 설치 지침을 참조하십시오.

낮은 메타데이터 스토리지

오브젝트 메타데이터를 저장하는 데 사용할 수 있는 공간이 부족합니다.

  • 긴급 경보 *

    1. 개체 인제스트를 중지합니다.

    2. 확장 절차에서 스토리지 노드를 즉시 추가합니다.

  • 주요 경고 *

확장 절차에서 스토리지 노드를 즉시 추가합니다.

  • 보조 알림 *

    1. 오브젝트 메타데이터 공간이 사용되는 속도를 모니터링합니다. nodes * > *Storage Node * > * Storage * 를 선택하고 Storage Used - Object Metadata 그래프를 봅니다.

    2. 에 스토리지 노드를 추가합니다 확장 절차 빨리.

새 스토리지 노드가 추가되면 시스템이 모든 스토리지 노드에서 개체 메타데이터를 자동으로 재조정하며 경보가 지워집니다.

에서 메타데이터 저장 부족 경고에 대한 지침을 참조하십시오 메타데이터 문제를 해결합니다.

낮은 메트릭 디스크 용량

메트릭 데이터베이스에 사용할 수 있는 공간이 부족합니다.

  1. 이 경고를 모니터링하여 문제가 자체적으로 해결되고 디스크 공간을 다시 사용할 수 있는지 확인합니다.

  2. 사용 가능한 공간이 계속 줄어지면 기술 지원 부서에 문의하십시오.

오브젝트 데이터 스토리지가 부족합니다

오브젝트 데이터를 저장하는 데 사용할 수 있는 공간이 부족합니다.

확장 절차를 수행합니다. 기존 스토리지 노드에 스토리지 볼륨(LUN)을 추가하거나 새 스토리지 노드를 추가할 수 있습니다.

읽기 전용 로우 워터마크가 무시됩니다

스토리지 볼륨 소프트 읽기 전용 워터마크 재정의는 스토리지 노드에 대해 최적화된 최소 워터마크보다 작습니다.

이 경고를 해결하는 방법을 알아보려면 로 이동하십시오 낮은 읽기 전용 배경무늬 재정의 알림 문제 해결.

루트 디스크 용량이 부족합니다

루트 디스크에 사용할 수 있는 공간이 부족합니다.

  1. 이 경고를 모니터링하여 문제가 자체적으로 해결되고 디스크 공간을 다시 사용할 수 있는지 확인합니다.

  2. 사용 가능한 공간이 계속 줄어지면 기술 지원 부서에 문의하십시오.

시스템 데이터 용량이 부족합니다

'/var/local' 파일 시스템에서 StorageGRID 시스템 데이터에 사용할 수 있는 공간이 부족합니다.

  1. 이 경고를 모니터링하여 문제가 자체적으로 해결되고 디스크 공간을 다시 사용할 수 있는지 확인합니다.

  2. 사용 가능한 공간이 계속 줄어지면 기술 지원 부서에 문의하십시오.

tmp 디렉토리 여유 공간이 부족합니다

/tmp 디렉토리에 사용 가능한 공간이 부족합니다.

  1. 이 경고를 모니터링하여 문제가 자체적으로 해결되고 디스크 공간을 다시 사용할 수 있는지 확인합니다.

  2. 사용 가능한 공간이 계속 줄어지면 기술 지원 부서에 문의하십시오.

노드 네트워크 연결 오류입니다

노드 간에 데이터를 전송하는 동안 오류가 발생했습니다.

네트워크 연결 오류는 수동 개입 없이 해결할 수 있습니다. 오류가 해결되지 않으면 기술 지원 부서에 문의하십시오.

에서 NRER(Network Receive Error) 경보에 대한 지침을 참조하십시오 네트워크, 하드웨어 및 플랫폼 문제를 해결합니다.

노드 네트워크 수신 프레임 오류입니다

노드에서 수신한 네트워크 프레임의 비율이 높은 경우 오류가 발생했습니다.

이 알림은 이더넷 연결 양쪽 끝에서 케이블 불량 또는 트랜시버 오류 등의 하드웨어 문제를 나타낼 수 있습니다.

  1. 어플라이언스를 사용하는 경우 각 SFP+ 또는 SFP28 트랜시버 및 케이블을 한 번에 하나씩 교체하여 경고가 사라지는지 확인하십시오.

  2. 이 경고가 지속되면 기술 지원 팀에 문의하십시오.

노드가 NTP 서버와 동기화되지 않았습니다

노드 시간이 NTP(네트워크 시간 프로토콜) 서버와 동기화되지 않습니다.

  1. Stratum 3 이상의 참조를 제공하는 외부 NTP 서버를 4개 이상 지정했는지 확인합니다.

  2. 모든 NTP 서버가 정상적으로 작동하는지 확인합니다.

  3. NTP 서버에 대한 연결을 확인합니다. 방화벽에 의해 차단되지 않았는지 확인합니다.

NTP 서버로 잠겨 있지 않은 노드입니다

노드가 네트워크 시간 프로토콜(NTP) 서버에 잠기지 않았습니다.

  1. Stratum 3 이상의 참조를 제공하는 외부 NTP 서버를 4개 이상 지정했는지 확인합니다.

  2. 모든 NTP 서버가 정상적으로 작동하는지 확인합니다.

  3. NTP 서버에 대한 연결을 확인합니다. 방화벽에 의해 차단되지 않았는지 확인합니다.

비어플라이언스 노드 네트워크가 다운되었습니다

하나 이상의 네트워크 장치가 다운되었거나 연결이 끊어졌습니다. 이 알림은 가상 머신 또는 Linux 호스트에 설치된 노드의 네트워크 인터페이스(eth)에 액세스할 수 없음을 나타냅니다.

기술 지원 부서에 문의하십시오.

개체 존재 여부를 확인하지 못했습니다

개체 존재 확인 작업이 실패했습니다.

  1. 유지보수 > 개체 존재 확인 * 을 선택합니다.

  2. 오류 메시지를 확인합니다. 적절한 수정 조치를 수행합니다.

    • 시작 실패 *, * 연결 끊김 *, * 알 수 없는 오류 *

      1. 작업에 포함된 스토리지 노드 및 볼륨이 온라인 상태이고 사용 가능한지 확인합니다.

      2. 스토리지 노드에 서비스 또는 볼륨 장애가 없는지 확인합니다. 서비스가 실행되고 있지 않으면 서비스를 시작하거나 다시 시작합니다. 를 참조하십시오 복구 및 유지 관리 지침.

      3. 선택한 일관성 제어가 충족될 수 있는지 확인합니다.

      4. 문제를 해결한 후 * Retry *(재시도 *)를 선택합니다. 마지막 유효한 상태에서 작업이 재개됩니다.

    • 볼륨의 중요한 스토리지 오류 *

      1. 장애가 발생한 볼륨을 복구합니다. 를 참조하십시오 복구 및 유지 관리 지침.

      2. 재시도 * 를 선택합니다.

      3. 작업이 완료된 후 노드의 나머지 볼륨에 대해 다른 작업을 생성하여 추가 오류를 확인합니다.

  3. 문제를 해결할 수 없는 경우 기술 지원 부서에 문의하십시오.

개체 존재 검사가 중단되었습니다

개체 존재 확인 작업이 중단되었습니다.

개체 존재 확인 작업을 계속할 수 없습니다. 작업에 포함된 하나 이상의 스토리지 노드 또는 볼륨이 오프라인 상태이거나 응답하지 않거나, 너무 많은 노드가 다운되었거나 사용할 수 없기 때문에 선택한 정합성 제어를 더 이상 충족할 수 없습니다.

  1. 확인 중인 모든 스토리지 노드 및 볼륨이 온라인 상태이고 사용 가능한지 확인합니다(* 노드 * 선택).

  2. 현재 코디네이터 노드가 선택한 정합성 제어를 사용하여 객체 메타데이터를 읽을 수 있도록 충분한 스토리지 노드가 온라인 상태이고 사용 가능한지 확인합니다. 필요한 경우 서비스를 시작하거나 다시 시작합니다. 를 참조하십시오 복구 및 유지 관리 지침.

    1단계와 2단계를 해결하면 작업이 꺼진 위치에서 자동으로 시작됩니다.

  3. 선택한 정합성 보장 제어가 충족되지 않으면 작업을 취소하고 더 낮은 정합성 제어를 사용하여 다른 작업을 시작합니다.

  4. 문제를 해결할 수 없는 경우 기술 지원 부서에 문의하십시오.

객체가 손실되었습니다

그리드에서 하나 이상의 오브젝트가 손실되었습니다.

이 알림은 데이터가 영구적으로 손실되었으며 검색할 수 없음을 나타낼 수 있습니다.

  1. 이 경고를 즉시 조사하십시오. 추가 데이터 손실을 방지하기 위해 조치를 취해야 할 수 있습니다. 프롬프트 작업을 수행하는 경우 손실된 개체를 복원할 수도 있습니다.

  2. 기본 문제가 해결되면 카운터를 재설정합니다.

    1. 지원 * > * 도구 * > * 그리드 토폴로지 * 를 선택합니다.

    2. 경고를 발생시킨 스토리지 노드의 경우 *site * > *GRID node * > * LDR * > * Data Store * > * Configuration * > * Main * 을 선택합니다.

    3. 손실된 개체 수 재설정 * 을 선택하고 * 변경 내용 적용 * 을 클릭합니다.

플랫폼 서비스를 사용할 수 없습니다

RSM 서비스가 실행 중이거나 사이트에서 사용 가능한 스토리지 노드가 너무 적습니다.

영향을 받는 사이트에서 RSM 서비스가 있는 스토리지 노드 중 대부분이 실행 중이고 오류가 없는 상태인지 확인합니다.

의 "플랫폼 서비스 문제 해결"을 참조하십시오 StorageGRID 관리 지침.

S3 PUT 오브젝트 크기가 너무 큽니다

S3 클라이언트가 S3 크기 제한을 초과하는 Put Object 작업을 수행하려고 합니다.

  1. 알림 세부 정보에 표시된 테넌트 ID를 사용하여 테넌트 계정을 식별합니다.

  2. 지원 * > * 도구 * > * 로그 * 로 이동하여 경고 세부 정보에 표시된 스토리지 노드에 대한 애플리케이션 로그를 수집합니다. 경고 시간 15분 전후의 기간을 지정합니다.

  3. 다운로드한 아카이브를 추출하고 'bycast.log'('/GID <grid_id>_<time_stamp>/<site_node>/<time_stamp>/grid/bycast.log')의 위치로 이동합니다.

  4. bycast.log의 내용을 검색하여 method=put을 찾은 다음 clientIP 필드를 보고 S3 클라이언트의 IP 주소를 확인합니다.

  5. 모든 클라이언트 사용자에게 최대 Put Object 크기가 5GiB임을 알립니다.

  6. 5GiB보다 큰 개체에 대해 멀티파트 업로드를 사용합니다.

관리 네트워크 포트 1에서 서비스 어플라이언스 링크가 다운되었습니다

어플라이언스의 관리 네트워크 포트 1이 다운되었거나 연결이 해제되었습니다.

  1. 관리 네트워크 포트 1에 대한 케이블 및 물리적 연결을 확인합니다.

  2. 모든 연결 문제를 해결합니다. 어플라이언스 하드웨어의 설치 및 유지 관리 지침을 참조하십시오.

  3. 이 포트가 의도적으로 연결이 끊어진 경우 이 규칙을 비활성화하십시오. Grid Manager에서 * alerts * > * rules * 를 선택하고 규칙을 선택한 다음 * Edit rule * 을 클릭합니다. 그런 다음 * 사용 * 확인란의 선택을 취소합니다.

관리 네트워크(또는 클라이언트 네트워크)에서 서비스 어플라이언스 링크가 다운되었습니다.

관리 네트워크(eth1) 또는 클라이언트 네트워크(eth2)에 대한 어플라이언스 인터페이스가 다운되거나 연결이 끊겼습니다.

  1. StorageGRID 네트워크에 대한 케이블, SFP 및 물리적 연결을 확인합니다.

  2. 모든 연결 문제를 해결합니다. 어플라이언스 하드웨어의 설치 및 유지 관리 지침을 참조하십시오.

  3. 이 포트가 의도적으로 연결이 끊어진 경우 이 규칙을 비활성화하십시오. Grid Manager에서 * alerts * > * rules * 를 선택하고 규칙을 선택한 다음 * Edit rule * 을 클릭합니다. 그런 다음 * 사용 * 확인란의 선택을 취소합니다.

네트워크 포트 1, 2, 3 또는 4에서 서비스 어플라이언스 링크가 다운되었습니다

어플라이언스의 네트워크 포트 1, 2, 3 또는 4가 다운되었거나 연결이 해제되었습니다.

  1. StorageGRID 네트워크에 대한 케이블, SFP 및 물리적 연결을 확인합니다.

  2. 모든 연결 문제를 해결합니다. 어플라이언스 하드웨어의 설치 및 유지 관리 지침을 참조하십시오.

  3. 이 포트가 의도적으로 연결이 끊어진 경우 이 규칙을 비활성화하십시오. Grid Manager에서 * alerts * > * rules * 를 선택하고 규칙을 선택한 다음 * Edit rule * 을 클릭합니다. 그런 다음 * 사용 * 확인란의 선택을 취소합니다.

서비스 어플라이언스의 스토리지 연결이 저하되었습니다

서비스 어플라이언스의 두 SSD 중 하나에 장애가 발생했거나 다른 SSD와 동기화되지 않았습니다.

어플라이언스 기능은 영향을 받지 않지만 문제를 즉시 해결해야 합니다. 두 드라이브 모두에 장애가 발생할 경우 어플라이언스가 더 이상 작동하지 않습니다.

  1. Grid Manager에서 * nodes * > *_services appliance_를 선택한 다음 Hardware * 탭을 선택합니다.

  2. Storage RAID Mode * 필드에서 메시지를 검토합니다.

  3. 메시지에 재동기화 작업의 진행률이 표시되면 작업이 완료될 때까지 기다린 다음 알림이 해결되었는지 확인합니다. 재동기화 메시지는 SSD가 최근에 교체되었거나 다른 이유로 재동기화 중임을 의미합니다.

  4. SSD 중 하나에 오류가 발생했음을 나타내는 메시지가 표시되면 가능한 한 빨리 장애가 발생한 드라이브를 교체합니다.

    서비스 어플라이언스에서 드라이브를 교체하는 방법에 대한 지침은 SG100 및 SG1000 어플라이언스 설치 및 유지 관리 가이드를 참조하십시오.

관리 네트워크 포트 1에서 스토리지 어플라이언스 링크가 다운되었습니다

어플라이언스의 관리 네트워크 포트 1이 다운되었거나 연결이 해제되었습니다.

  1. 관리 네트워크 포트 1에 대한 케이블 및 물리적 연결을 확인합니다.

  2. 모든 연결 문제를 해결합니다. 어플라이언스 하드웨어의 설치 및 유지 관리 지침을 참조하십시오.

  3. 이 포트가 의도적으로 연결이 끊어진 경우 이 규칙을 비활성화하십시오. Grid Manager에서 * alerts * > * rules * 를 선택하고 규칙을 선택한 다음 * Edit rule * 을 클릭합니다. 그런 다음 * 사용 * 확인란의 선택을 취소합니다.

관리 네트워크(또는 클라이언트 네트워크)에서 스토리지 어플라이언스 링크가 다운되었습니다.

관리 네트워크(eth1) 또는 클라이언트 네트워크(eth2)에 대한 어플라이언스 인터페이스가 다운되거나 연결이 끊겼습니다.

  1. StorageGRID 네트워크에 대한 케이블, SFP 및 물리적 연결을 확인합니다.

  2. 모든 연결 문제를 해결합니다. 어플라이언스 하드웨어의 설치 및 유지 관리 지침을 참조하십시오.

  3. 이 포트가 의도적으로 연결이 끊어진 경우 이 규칙을 비활성화하십시오. Grid Manager에서 * alerts * > * rules * 를 선택하고 규칙을 선택한 다음 * Edit rule * 을 클릭합니다. 그런 다음 * 사용 * 확인란의 선택을 취소합니다.

네트워크 포트 1, 2, 3 또는 4에서 스토리지 어플라이언스 링크가 다운되었습니다

어플라이언스의 네트워크 포트 1, 2, 3 또는 4가 다운되었거나 연결이 해제되었습니다.

  1. StorageGRID 네트워크에 대한 케이블, SFP 및 물리적 연결을 확인합니다.

  2. 모든 연결 문제를 해결합니다. 어플라이언스 하드웨어의 설치 및 유지 관리 지침을 참조하십시오.

  3. 이 포트가 의도적으로 연결이 끊어진 경우 이 규칙을 비활성화하십시오. Grid Manager에서 * alerts * > * rules * 를 선택하고 규칙을 선택한 다음 * Edit rule * 을 클릭합니다. 그런 다음 * 사용 * 확인란의 선택을 취소합니다.

스토리지 어플라이언스 스토리지 연결이 저하되었습니다

컴퓨팅 컨트롤러와 스토리지 컨트롤러 사이에 하나 이상의 연결에 문제가 있습니다.

  1. 포트 표시등을 확인하려면 제품으로 이동하십시오.

  2. 포트의 표시등이 꺼져 있는 경우 케이블이 제대로 연결되어 있는지 확인합니다. 필요한 경우 케이블을 교체합니다.

  3. 최대 5분 동안 기다립니다.

    • 참고: * 두 번째 케이블을 교체해야 하는 경우 최소 5분 동안 케이블을 분리하지 마십시오. 그렇지 않으면 루트 볼륨이 읽기 전용이 되어 하드웨어를 다시 시작해야 할 수 있습니다.

  4. Grid Manager에서 * nodes * 를 선택합니다. 그런 다음 문제가 있는 노드의 Hardware 탭을 선택합니다. 경고 상태가 해결되었는지 확인합니다.

스토리지 디바이스를 액세스할 수 없습니다

스토리지 디바이스를 액세스할 수 없습니다.

이 알림은 기본 스토리지 디바이스의 문제로 인해 볼륨을 마운트하거나 액세스할 수 없음을 나타냅니다.

  1. 노드에 사용된 모든 스토리지 디바이스의 상태를 확인합니다.

  2. 필요한 경우 구성 요소를 교체합니다. 사용 중인 제품의 지침을 참조하십시오.

테넌트 할당량 사용량이 높습니다

테넌트 할당량 공간의 높은 비율이 사용되고 있습니다. 테넌트가 할당량을 초과하면 새 베스트 일스트가 거부됩니다.

  • 참고: * 이 경고 규칙은 많은 알림을 생성할 수 있으므로 기본적으로 비활성화되어 있습니다.

    1. Grid Manager에서 * Tenants * 를 선택합니다.

    2. 할당량 사용량 * 을 기준으로 테이블을 정렬합니다.

    3. 할당량 활용률이 100%에 가까운 테넌트를 선택합니다.

    4. 다음 중 하나 또는 모두를 수행합니다.

      • 테넌트에 대한 저장소 할당량을 늘리려면 * 편집 * 을 선택합니다.

      • 할당량의 활용도가 높다고 테넌트에 알립니다.

노드와 통신할 수 없습니다

하나 이상의 서비스가 응답하지 않거나 노드에 연결할 수 없습니다.

이 알림은 알 수 없는 이유로 노드의 연결이 끊겼음을 나타냅니다. 예를 들어, 노드의 서비스가 중지되거나 전원 장애 또는 예기치 않은 정전으로 인해 노드의 네트워크 연결이 끊겼을 수 있습니다.

이 경고를 모니터링하여 문제가 자체적으로 해결되는지 확인합니다. 문제가 지속되는 경우:

  1. 이 노드에 영향을 주는 다른 경고가 있는지 확인합니다. 이 경고는 다른 경고를 해결할 때 해결될 수 있습니다.

  2. 이 노드의 모든 서비스가 실행 중인지 확인합니다. 서비스가 중지된 경우 서비스를 시작해 보십시오. 를 참조하십시오 복구 및 유지 관리 지침.

  3. 노드의 호스트 전원이 켜져 있는지 확인합니다. 그렇지 않으면 호스트를 시작합니다.

  4. 이 노드와 관리자 노드 사이에 네트워크 연결 문제가 있는지 확인합니다.

  5. 경고를 해결할 수 없는 경우 기술 지원 팀에 문의하십시오.

예기치 않은 노드 재부팅

지난 24시간 동안 노드가 예기치 않게 재부팅되었습니다.

  1. 이 경고를 모니터링합니다. 24시간이 지나면 경고가 지워집니다. 그러나 노드가 다시 예기치 않게 재부팅되면 이 경고가 다시 발생합니다.

  2. 경고를 해결할 수 없는 경우 하드웨어 오류가 발생할 수 있습니다. 기술 지원 부서에 문의하십시오.

알 수 없는 손상된 개체가 감지되었습니다

복제된 오브젝트로 식별되지 않는 파일이 복제된 오브젝트 스토리지에 있습니다.

  1. 스토리지 노드의 기본 스토리지에 문제가 있는지 확인합니다. 예를 들어, 하드웨어 진단을 실행하거나 파일 시스템 검사를 수행합니다.

  2. 스토리지 문제를 해결한 후 개체 존재 확인 실행 ILM 정책에 정의된 복제된 복사본이 없는지 확인합니다.

  3. 이 경고를 모니터링합니다. 이 알림은 24시간 후에 해결되지만 문제가 해결되지 않으면 다시 트리거됩니다.

  4. 경고를 해결할 수 없는 경우 기술 지원 팀에 문의하십시오.