ONTAP SVM Data Collector 문제 해결
워크로드 보안은 데이터 수집기를 사용하여 디바이스에서 파일 및 사용자 액세스 데이터를 수집합니다. 여기에서 이 수집기와 관련된 문제 해결을 위한 팁을 찾을 수 있습니다.
"SVM Collector 구성"이 Collector 구성에 대한 지침은 페이지를 참조하십시오.
문제 해결
알려진 문제와 해결 방법은 다음 표에 설명되어 있습니다.
오류의 경우, _Status_열에서 _more detail_을 클릭하여 오류에 대한 세부 정보를 확인하십시오.
문제: | 해상도: |
---|---|
Data Collector는 일정 시간 동안 실행되며 임의 시간 후 중지되며, "오류 메시지: 커넥터가 오류 상태입니다. 서비스 이름: 감사. 장애 원인: 외부 FPolicy 서버가 과부하 상태입니다." |
ONTAP의 이벤트 발생률은 상담원 박스가 처리할 수 있는 것보다 훨씬 높았습니다. 따라서 연결이 종료되었습니다. 연결이 끊겼을 때 CloudSecure의 최대 트래픽을 확인합니다. 이는 * CloudSecure > Activity Forensics > All Activity * 페이지에서 확인할 수 있습니다. 최대 집계된 트래픽이 Agent Box에서 처리할 수 있는 트래픽보다 높은 경우 Agent Box에서 Collector 배포를 사이징하는 방법에 대한 이벤트 속도 검사기 페이지를 참조하십시오. 2021년 3월 4일 이전에 Agent 상자에 Agent를 설치한 경우, Agent 상자에서 echo 'net.core.rmem_max=8388608'> /etc/sysctl.conf echo'net.ipv4.tcp_rmem=4096 2097152 838608'> /etc/sysctl.sysctl.UI를 다시 시작한 후 다시 시작합니다. |
수집기가 오류 메시지를 보고합니다: "SVM의 데이터 인터페이스에 연결할 수 있는 커넥터에서 로컬 IP 주소를 찾을 수 없습니다." |
이는 ONTAP 측의 네트워킹 문제 때문일 가능성이 가장 높습니다. 다음 단계를 따르십시오. 1. SVM의 연결을 차단하는 관리 리소스나 SVM 데이터 거짓에 방화벽이 없는지 확인합니다. 2. 클러스터 관리 IP를 통해 SVM을 추가할 때는 SVM의 데이터 lif 및 관리 lif가 Agent VM에서 Pingable인지 확인하십시오. 문제가 발생한 경우, lif에 대한 게이트웨이, 넷마스크 및 경로를 확인하십시오. 클러스터 관리 IP를 사용하여 ssh를 통해 클러스터에 로그인하고 에이전트 IP를 Ping할 수도 있습니다. 에이전트 IP가 Ping할 수 있는지 확인합니다. _ network ping -vserver <vserver name> -destination <Agent ip> -lif <LIF Name> -show-detail_이 Ping할 수 없는 경우 ONTAP의 네트워크 설정이 올바른지 확인하여 에이전트 시스템이 Ping할 수 있는지 확인합니다. 3. 클러스터 IP를 통해 연결을 시도했지만 작동하지 않는 경우 SVM IP를 통해 직접 연결해 보십시오. SVM IP를 통해 연결하는 단계는 위 섹션을 참조하십시오. 4. SVM IP 및 vsadmin 자격 증명을 통해 수집기를 추가하는 동안 SVM LIF에 데이터 플러스 관리 역할이 활성화되어 있는지 확인하십시오. 이 경우 SVM LIF로 ping을 수행할 수 있지만 SVM LIF에 대한 SSH는 작동하지 않습니다. SVM 관리 전용 LIF를 생성한 후 이 SVM 관리 전용 LIF를 통해 연결을 시도하십시오. 5. 그래도 해결되지 않으면 새 SVM LIF를 생성하고 이 LIF를 통해 연결을 시도하십시오. 서브넷 마스크가 올바르게 설정되었는지 확인합니다. 6. 고급 디버깅: a) ONTAP에서 패킷 추적을 시작합니다. b) CloudSecure UI에서 데이터 수집기를 SVM에 연결해 봅니다. c) 오류가 나타날 때까지 기다립니다. ONTAP에서 패킷 추적을 중지합니다. d) ONTAP에서 패킷 추적을 엽니다. 이 위치에서 사용할 수 있습니다. _\https://<cluster_mgmt_ip>/SPI/<clustername>/etc/log/packet_traces/_e) ONTAP에서 에이전트 상자로 SYN이 있는지 확인합니다. f) ONTAP에서 SYN이 없으면 ONTAP의 방화벽에 문제가 됩니다. g) ONTAP에서 방화벽을 열어 ONTAP가 에이전트 상자를 연결할 수 있도록 합니다. 7. 여전히 작동하지 않으면 네트워킹 팀에 문의하여 ONTAP에서 Agent Box로의 연결을 차단하는 외부 방화벽이 없는지 확인하십시오. 8. 포트 7이 열려 있는지 확인합니다. 9. 위의 방법으로 문제가 해결되지 않으면 에서 케이스를 열어 추가 지원을 받으십시오"NetApp 지원". |
메시지: "[hostname:<IP Address>에 대한 ONTAP 유형을 확인하지 못했습니다. 이유: 스토리지 시스템에 대한 접속 오류 <IP 주소>: 호스트에 연결할 수 없습니다(호스트에 연결할 수 없음)" |
1. 올바른 SVM IP 관리 주소 또는 클러스터 관리 IP를 입력했는지 확인합니다. 2. 연결할 SVM 또는 클러스터에 대한 SSH입니다. 연결이 완료되면 SVM 또는 클러스터 이름이 올바른지 확인합니다. |
오류 메시지: "커넥터가 오류 상태입니다. service.name: 감사. 실패 이유: 외부 FPolicy 서버가 종료되었습니다." |
1. 방화벽이 에이전트 시스템의 필요한 포트를 차단하고 있을 가능성이 높습니다. 에이전트 시스템이 SVM에서 연결할 수 있도록 포트 범위 35000-55000/TCP가 열려 있는지 확인합니다. 또한 ONTAP 측 차단 통신에서 에이전트 시스템로의 방화벽이 활성화되어 있지 않은지 확인합니다. 2. Agent 상자에 다음 명령을 입력하고 포트 범위가 열려 있는지 확인합니다. _sudo iptables -save |
grep 3500 * Sample 출력은 다음과 같아야 합니다. _ -a in_public_allow -p tcp -m -dport 35000 -m conntrack -ctstate new -j accept_3. SVM에 로그인하고 다음 명령을 입력한 후 ONTAP와의 통신을 차단하는 방화벽이 설정되어 있지 않은지 확인합니다. _SYSTEM SERVICES FILES SHOW__SYSTEM SERVICES FILERE POLICY SHOW "방화벽 명령을 확인합니다"ONTAP 측 4. 모니터링할 SVM/클러스터에 SSH를 연결합니다. CIFS, NFS 프로토콜 지원)을 사용하여 SVM 데이터 거짓에서 에이전트 상자를 ping하고 ping이 작동하는지 확인합니다. _network ping -vserver <vserver name> -destination <Agent IP> -lif <LIF Name> -show-detail_만약 Ping할 수 없으면 ONTAP의 네트워크 설정이 올바른지 확인하여 에이전트 시스템이 Ping할 수 있도록 합니다. 데이터 수집기 2개를 통해 테넌트에 단일 SVM을 두 번 추가하면 이 오류가 표시됩니다. UI를 통해 데이터 수집기 중 하나를 삭제합니다. 그런 다음 UI를 통해 다른 데이터 수집기를 다시 시작합니다. 그러면 데이터 수집기가 "실행 중" 상태를 표시하고 SVM에서 이벤트를 수신하기 시작합니다. 기본적으로 테넌트에서 1개의 SVM은 1개의 데이터 수집기를 통해 한 번만 추가해야 합니다. 1 SVM은 2개의 데이터 수집기를 통해 두 번 추가해서는 안 됩니다. 6. 동일한 SVM이 두 개의 서로 다른 워크로드 보안 환경(테넌트)에 추가된 경우, 마지막 SVM은 항상 성공합니다. 두 번째 수집기는 FPolicy를 자체 IP 주소로 구성하고 첫 번째 것을 시작합니다. 따라서 첫 번째 수집기는 이벤트 수신을 중지하고 "감사" 서비스가 오류 상태로 전환됩니다. 이를 방지하려면 각 SVM을 단일 환경에서 구성합니다. 7. 이 오류는 서비스 정책이 올바르게 구성되지 않은 경우에도 발생할 수 있습니다. ONTAP 9.8 이상에서는 데이터 소스 수집기에 연결하기 위해 데이터 서비스 데이터 서비스 데이터(NFS 및/또는 데이터 CIFS)와 함께 데이터 FPolicy 클라이언트 서비스가 필요합니다. 또한 데이터-FPolicy-클라이언트 서비스는 모니터링되는 SVM에 대한 데이터 거짓과 연결되어야 합니다. |
활동 페이지에 이벤트가 표시되지 않습니다. |
1. ONTAP Collector가 "실행 중" 상태인지 확인합니다. 예 인 경우 일부 파일을 열어 CIFS 클라이언트 VM에서 일부 CIFS 이벤트가 생성되는지 확인합니다. 2. 활동이 표시되지 않는 경우 SVM에 로그인하고 다음 명령을 입력하십시오. <SVM> 이벤트 로그에 -소스 FPolicy_FPolicy와 관련된 오류가 없는지 확인하십시오. 3. 활동이 표시되지 않는 경우 SVM에 로그인하십시오. 다음 명령을 입력합니다. _<SVM>FPolicy show_Check 접두사 "cloudsecure"로 명명된 FPolicy 정책이 설정되어 있고 상태가 "on"인지 확인합니다. 설정되지 않으면 Agent가 SVM에서 명령을 실행할 수 없을 가능성이 높습니다. 페이지 시작 부분에 설명된 모든 필수 구성 요소가 준수되었는지 확인하십시오. |
SVM Data Collector가 오류 상태이고 오류 메시지가 "에이전트가 수집기에 연결하지 못했습니다"입니다. |
1. 대부분의 경우 Agent가 오버로드되어 데이터 소스 수집기에 연결할 수 없습니다. 2. Agent에 연결된 데이터 소스 수집기의 수를 확인합니다. 3. 또한 UI의 "모든 활동" 페이지에서 데이터 흐름 속도도 확인합니다. 4. 초당 작업 수가 상당히 많은 경우 다른 에이전트를 설치하고 일부 데이터 소스 수집기를 새 에이전트로 이동합니다. |
SVM Data Collector에서 "fpolicy.server.connectError: Node가 FPolicy 서버 "12.195.15.146"과 연결을 설정하지 못했습니다(이유: "Select Timed Out")"라는 오류 메시지를 표시합니다. |
SVM/클러스터에서 방화벽이 활성화됩니다. FPolicy 엔진이 FPolicy 서버에 연결할 수 없습니다. 자세한 정보를 얻는 데 사용할 수 있는 ONTAP의 CLI는 이벤트 로그 표시 - 소스 FPolicy입니다. FPolicy는 오류 이벤트 로그 표시 - 소스 FPolicy - 필드 이벤트, 작업, 설명입니다. 자세한 내용은 표시됩니다. "방화벽 명령을 확인합니다" ONTAP 측면. |
오류 메시지: “커넥터가 오류 상태입니다. 서비스 이름: 감사. 장애 원인: SVM에서 유효한 데이터 인터페이스(역할: 데이터, 데이터 프로토콜: NFS 또는 CIFS 또는 둘 다, 상태: UP)를 찾을 수 없습니다." |
운영 인터페이스(데이터 및 데이터 프로토콜 역할을 CIFS/NFS로 사용)가 있는지 확인합니다. |
데이터 수집기는 오류 상태가 된 다음 일정 시간이 지나면 실행 중 상태가 되고 다시 오류 상태로 돌아갑니다. 이 주기가 반복됩니다. |
이 문제는 일반적으로 다음 시나리오에서 발생합니다. 1. 추가된 데이터 수집기가 여러 개 있습니다. 2. 이러한 동작을 보여주는 데이터 수집기는 이러한 데이터 수집기에 1개의 SVM을 추가합니다. 즉, 2개 이상의 데이터 수집기가 1개의 SVM에 연결됩니다. 3. 1개의 데이터 수집기가 1개의 SVM에만 연결되도록 합니다. 4. 동일한 SVM에 연결된 다른 데이터 수집기를 삭제합니다. |
커넥터가 오류 상태입니다. 서비스 이름: 감사. 실패 원인: 구성하지 못했습니다(SVM svmname에 대한 정책). 이유: 'FPolicy.policy.scope-modify:"연방" 내의 '포함할' 요소에 대해 잘못된 값이 지정되었습니다. |
공유 이름은 따옴표 없이 지정해야 합니다. ONTAP SVM DSC 구성을 편집하여 공유 이름을 수정하십시오. _INCLUDE 및 EXCLUDE_는 긴 공유 이름 목록에 사용할 수 없습니다. 포함 또는 제외할 공유 수가 많은 경우 대신 볼륨별 필터링을 사용합니다. |
클러스터에 사용되지 않는 기존 fpolicies가 있습니다. 워크로드 보안을 설치하기 전에 이러한 작업을 어떻게 해야 합니까? |
사용되지 않는 기존 FPolicy 설정이 연결되지 않은 경우에도 모두 삭제하는 것이 좋습니다. 워크로드 보안에서는 접두사 "cloudsecure_"를 사용하여 FPolicy를 생성합니다. 사용되지 않는 다른 모든 FPolicy 구성은 삭제할 수 있습니다. FPolicy 목록을 표시하는 CLI 명령:_FPolicy show_steps FPolicy 구성을 삭제하는 방법:_FPolicy disable -vserver <svmname> -policy -name <policy_name>_FPolicy scope delete -vserver <svmname>_FPolicy -policy -name <policy_name>_FPolicy_vserver_name <정책 삭제 -vserver_name <policy_name> |
워크로드 보안을 활성화한 후 ONTAP 성능에 영향을 미침: 지연 시간이 산발적으로 높고 IOPS가 산발적으로 낮아지는 경우 |
워크로드 보안과 함께 ONTAP를 사용할 때 ONTAP에서 지연 시간 문제가 나타날 수 있습니다. 다음과 같은 여러 가지 가능한 이유가 있습니다: "1372994", "1415152", "1438207", , "1479704" "1354659" . 이러한 모든 문제는 ONTAP 9.13.1 이상에서 수정되었으며 이러한 최신 버전 중 하나를 사용하는 것이 좋습니다. |
데이터 수집기가 오류 중입니다. 이 오류 메시지를 표시합니다. "오류: 커넥터가 오류 상태입니다. 서비스 이름: 감사. 실패 원인: SVM svm_test에서 정책을 구성하지 못했습니다. 이유: ZAPI 필드에 값이 없습니다. 이벤트 “ |
NFS 서비스만 구성하여 새로운 SVM으로 시작하십시오. 워크로드 보안에서 ONTAP SVM 데이터 수집기 추가 CIFS는 SVM을 위한 허용 프로토콜로 구성된 동시에 워크로드 보안에서 ONTAP SVM Data Collector를 추가합니다. 워크로드 보안의 데이터 수집기에 오류가 표시될 때까지 기다립니다. SVM에 CIFS 서버가 구성되어 있지 않으므로 왼쪽에 표시된 이 오류는 워크로드 보안으로 표시됩니다. ONTAP SVM 데이터 수집기를 편집하고 CIFS를 허용된 프로토콜로 선택 취소하십시오. 데이터 수집기를 저장합니다. NFS 프로토콜만 활성화된 상태에서 실행됩니다. |
Data Collector에 다음과 같은 오류 메시지가 표시됩니다. "오류: 2회 재시도에서 Collector 상태를 확인하지 못했습니다. Collector를 다시 시작하십시오(오류 코드: AGENT008)." |
1. 데이터 수집기 페이지에서 오류가 있는 데이터 수집기의 오른쪽으로 스크롤한 다음 3개의 점 메뉴를 클릭합니다. 편집 _ 을(를) 선택합니다. 데이터 수집기의 암호를 다시 입력합니다. Save _ 버튼을 눌러 데이터 수집기를 저장합니다. Data Collector가 다시 시작되고 오류가 해결되어야 합니다. 2. Agent 시스템에 CPU 또는 RAM 여유 공간이 충분하지 않을 수 있으므로 DSC가 실패합니다. 시스템의 에이전트에 추가되는 데이터 수집기 수를 확인하십시오. 20개를 초과하는 경우 Agent 시스템의 CPU 및 RAM 용량을 늘리십시오. CPU와 RAM이 증가되면 DSC가 초기화 중 상태로 전환되었다가 자동으로 실행 상태로 전환됩니다. 에서 사이징 가이드를 "이 페이지"살펴봅니다. |
SVM 모드를 선택하면 Data Collector에서 오류가 발생합니다. |
그래도 문제가 발생하면 * 도움말 > 지원 * 페이지에 나와 있는 지원 링크를 참조하십시오.