ONTAP SVM Data Collector 문제 해결

별도의 PDF 문서 모음
Creating your file...
워크로드 보안은 데이터 수집기를 사용하여 디바이스에서 파일 및 사용자 액세스 데이터를 수집합니다. 여기에서 이 수집기와 관련된 문제 해결을 위한 팁을 찾을 수 있습니다.
"SVM Collector 구성"이 Collector 구성에 대한 지침은 페이지를 참조하십시오.
오류가 발생한 경우 Installed Data Collectors 페이지의 _Status_column에서 _more detail_을 클릭하여 오류에 대한 세부 정보를 확인할 수 있습니다.
알려진 문제 및 해결 방법은 아래에 설명되어 있습니다.
-
문제: * Data Collector가 일정 시간 동안 실행되고 임의의 시간 후에 중지되며 "오류 메시지: 커넥터가 오류 상태입니다. 서비스 이름: 감사. 장애 원인: 외부 FPolicy 서버가 과부하 상태입니다."
이 방법을 시도해 보십시오: ONTAP의 이벤트 발생률이 Agent Box가 처리할 수 있는 것보다 훨씬 높았습니다. 따라서 연결이 종료되었습니다.
연결이 끊겼을 때 CloudSecure의 최대 트래픽을 확인합니다. 이는 * CloudSecure > Activity Forensics > All Activity * 페이지에서 확인할 수 있습니다.
최대 집계된 트래픽이 Agent Box에서 처리할 수 있는 트래픽보다 높은 경우 Agent Box에서 Collector 배포를 사이징하는 방법에 대한 이벤트 속도 검사기 페이지를 참조하십시오.
Agent가 2021년 3월 4일 이전에 Agent 상자에 설치된 경우 Agent 상자에서 다음 명령을 실행합니다.
echo 'net.core.rmem_max=8388608' >> /etc/sysctl.conf echo 'net.ipv4.tcp_rmem = 4096 2097152 8388608' >> /etc/sysctl.conf sysctl -p
크기 조정 후 UI에서 Collector를 다시 시작합니다.
-
문제: * 수집기는 오류 메시지를 보고합니다: "SVM의 데이터 인터페이스에 도달할 수 있는 커넥터에 로컬 IP 주소를 찾을 수 없습니다." 이 방법을 시도해 보십시오: ONTAP 측의 네트워킹 문제 때문일 수 있습니다. 다음 단계를 따르십시오.
-
SVM의 연결을 차단하는 관리 리소스나 SVM 데이터 거짓에 방화벽이 없는지 확인합니다.
-
클러스터 관리 IP를 통해 SVM을 추가할 때는 SVM의 데이터 lif 및 관리 lif가 Agent VM에서 Pingable인지 확인하십시오. 문제가 발생한 경우, lif에 대한 게이트웨이, 넷마스크 및 경로를 확인하십시오.
클러스터 관리 IP를 사용하여 ssh를 통해 클러스터에 로그인하고 에이전트 IP를 Ping할 수도 있습니다. 에이전트 IP가 Ping할 수 있는지 확인합니다.
network ping -vserver <vserver name> -destination <Agent IP> -lif <Lif Name> -show-detail
Ping할 수 없는 경우 ONTAP의 네트워크 설정이 올바른지 확인하여 Agent 시스템이 Ping할 수 있도록 합니다.
-
클러스터 IP를 통해 연결을 시도했지만 작동하지 않는 경우 SVM IP를 통해 직접 연결해 보십시오. SVM IP를 통해 연결하는 단계는 위 섹션을 참조하십시오.
-
SVM IP 및 vsadmin 자격 증명을 통해 수집기를 추가하는 동안 SVM LIF에 데이터 플러스 관리 역할이 활성화되어 있는지 확인하십시오. 이 경우 SVM LIF로 ping을 수행할 수 있지만 SVM LIF에 대한 SSH는 작동하지 않습니다. SVM 관리 전용 LIF를 생성한 후 이 SVM 관리 전용 LIF를 통해 연결을 시도하십시오.
-
그래도 해결되지 않으면 새 SVM LIF를 생성하고 이 LIF를 통해 연결을 시도하십시오. 서브넷 마스크가 올바르게 설정되었는지 확인합니다.
-
고급 디버깅:
-
ONTAP에서 패킷 추적을 시작합니다.
-
CloudSecure UI에서 데이터 수집기를 SVM에 연결해 보십시오.
-
오류가 나타날 때까지 기다립니다. ONTAP에서 패킷 추적을 중지합니다.
-
ONTAP에서 패킷 추적을 엽니다. 이 위치에서 사용할 수 있습니다
https://<cluster_mgmt_ip>/spi/<clustername>/etc/log/packet_traces/ .. ONTAP에서 에이전트 상자로 SYN이 있는지 확인합니다. .. ONTAP의 SYN이 없는 경우 ONTAP의 방화벽 문제입니다. .. ONTAP에서 방화벽을 열어 ONTAP가 Agent Box를 연결할 수 있도록 합니다.
-
-
여전히 작동하지 않으면 네트워킹 팀에 문의하여 ONTAP에서 Agent Box로의 연결을 차단하는 외부 방화벽이 없는지 확인하십시오.
-
위의 방법으로 문제가 해결되지 않으면 에서 케이스를 열어 추가 지원을 받으십시오"NetApp 지원".
-
-
문제: * 메시지: " ONTAP[hostname:<IP Address>. 이유: 스토리지 시스템 <IP Address>에 대한 연결 오류: 호스트에 연결할 수 없습니다(호스트에 연결할 수 없음)" * 다음을 시도하십시오. *
-
올바른 SVM IP 관리 주소 또는 클러스터 관리 IP를 입력했는지 확인합니다.
-
연결할 SVM 또는 클러스터에 대한 SSH입니다. 연결이 완료되면 SVM 또는 클러스터 이름이 올바른지 확인합니다.
-
-
문제: * 오류 메시지: "커넥터가 오류 상태입니다. service.name: 감사. 실패 이유: 외부 FPolicy 서버가 종료되었습니다." * 사용해 보세요. *
-
방화벽이 에이전트 시스템의 필요한 포트를 차단하고 있을 가능성이 높습니다. 에이전트 시스템이 SVM에서 연결할 수 있도록 포트 범위 35000-55000/TCP가 열려 있는지 확인합니다. 또한 ONTAP 측 차단 통신에서 에이전트 시스템로의 방화벽이 활성화되어 있지 않은지 확인합니다.
-
Agent 상자에 다음 명령을 입력하고 포트 범위가 열려 있는지 확인합니다.
sudo iptables-save | grep 3500*
샘플 출력은 다음과 같아야 합니다.
-A IN_public_allow -p tcp -m tcp --dport 35000 -m conntrack -ctstate NEW -j ACCEPT . SVM에 로그인하고 다음 명령을 입력한 후 ONTAP와의 통신을 차단하는 방화벽이 설정되어 있지 않은지 확인합니다.
system services firewall show system services firewall policy show
"방화벽 명령을 확인합니다" ONTAP 측면.
-
모니터링할 SVM/클러스터에 SSH를 연결합니다. SVM 데이터 lif(CIFS, NFS 프로토콜 지원)에서 Agent Box에 ping을 수행하고 ping이 작동하는지 확인합니다.
network ping -vserver <vserver name> -destination <Agent IP> -lif <Lif Name> -show-detail
Ping할 수 없는 경우 ONTAP의 네트워크 설정이 올바른지 확인하여 Agent 시스템이 Ping할 수 있도록 합니다.
-
2개의 데이터 수집기를 통해 테넌트에 단일 SVM을 두 번 추가하면 이 오류가 표시됩니다. UI를 통해 데이터 수집기 중 하나를 삭제합니다. 그런 다음 UI를 통해 다른 데이터 수집기를 다시 시작합니다. 그러면 데이터 수집기가 "실행 중" 상태를 표시하고 SVM에서 이벤트를 수신하기 시작합니다.
기본적으로 테넌트에서 1개의 SVM은 1개의 데이터 수집기를 통해 한 번만 추가해야 합니다. 1 SVM은 2개의 데이터 수집기를 통해 두 번 추가해서는 안 됩니다.
-
동일한 SVM이 두 개의 서로 다른 워크로드 보안 환경(테넌트)에 추가된 경우, 마지막 SVM은 항상 성공합니다. 두 번째 수집기는 FPolicy를 자체 IP 주소로 구성하고 첫 번째 것을 시작합니다. 따라서 첫 번째 수집기는 이벤트 수신을 중지하고 "감사" 서비스가 오류 상태로 전환됩니다. 이를 방지하려면 각 SVM을 단일 환경에서 구성합니다.
-
이 오류는 서비스 정책이 올바르게 구성되지 않은 경우에도 발생할 수 있습니다. ONTAP 9.8 이상에서는 데이터 소스 수집기에 연결하기 위해 데이터 서비스 데이터 서비스 데이터(NFS 및/또는 데이터 CIFS)와 함께 데이터 FPolicy 클라이언트 서비스가 필요합니다. 또한 데이터-FPolicy-클라이언트 서비스는 모니터링되는 SVM에 대한 데이터 거짓과 연결되어야 합니다.
-
-
문제 : * 활동 페이지에 이벤트가 표시되지 않습니다. * 사용해 보세요. *
-
ONTAP Collector가 "실행 중" 상태인지 확인합니다. 예 인 경우 일부 파일을 열어 CIFS 클라이언트 VM에서 일부 CIFS 이벤트가 생성되는지 확인합니다.
-
활동이 표시되지 않는 경우 SVM에 로그인하고 다음 명령을 입력하십시오.
<SVM>event log show -source fpolicy
FPolicy와 관련된 오류가 없는지 확인하십시오.
-
활동이 표시되지 않는 경우 SVM에 로그인하십시오. 다음 명령을 입력합니다.
<SVM>fpolicy show
접두사 "cloudsecure_"로 명명된 FPolicy 정책이 설정되어 있고 상태가 "on"인지 확인합니다. 설정되지 않으면 Agent가 SVM에서 명령을 실행할 수 없을 가능성이 높습니다. 페이지 시작 부분에 설명된 모든 필수 구성 요소가 준수되었는지 확인하십시오.
-
-
문제: * SVM Data Collector가 오류 상태이고 오류 메시지는 "Agent가 Collector에 연결하지 못했습니다."입니다. * 다음을 시도하십시오. *
-
대부분의 경우 Agent가 오버로드되어 데이터 소스 수집기에 연결할 수 없습니다.
-
Agent에 연결된 데이터 소스 수집기의 수를 확인합니다.
-
또한 UI의 "모든 활동" 페이지에서 데이터 흐름 속도도 확인합니다.
-
초당 작업 수가 상당히 많은 경우 다른 에이전트를 설치하고 일부 데이터 소스 수집기를 새 에이전트로 이동합니다.
-
-
문제: * SVM Data Collector는 "fpolicy.server.connectError: 노드가 FPolicy 서버 "12.195.15.146"과의 연결을 설정하지 못했습니다"(이유: "시간 초과 선택")" 오류 메시지를 표시합니다. * 다음을 시도하십시오. * SVM/클러스터에서 방화벽이 활성화됩니다. FPolicy 엔진이 FPolicy 서버에 연결할 수 없습니다. 자세한 정보를 얻는 데 사용할 수 있는 ONTAP의 CLI는 다음과 같습니다.
event log show -source fpolicy which shows the error event log show -source fpolicy -fields event,action,description which shows more details.
"방화벽 명령을 확인합니다" ONTAP 측면.
-
문제: * 오류 메시지: "커넥터가 오류 상태입니다. 서비스 이름: 감사. 장애 원인: SVM에서 유효한 데이터 인터페이스(역할: 데이터, 데이터 프로토콜: NFS 또는 CIFS 또는 둘 다, 상태: UP)를 찾을 수 없습니다." * 이 작업을 시도하십시오. * 운영 인터페이스가 있는지 확인하십시오(CIFS/NFS로서 데이터 및 데이터 프로토콜 역할을 합니다.
-
문제 : * 데이터 수집기가 오류 상태로 들어간 다음 잠시 후 실행 상태로 돌아간 다음 다시 오류로 돌아갑니다. 이 주기가 반복됩니다. 이 방법을 시도해 보십시오: 일반적으로 다음과 같은 경우에 발생합니다.
-
추가된 데이터 수집기가 여러 개 있습니다.
-
이러한 동작을 보여주는 데이터 수집기는 이러한 데이터 수집기에 1개의 SVM을 추가합니다. 즉, 2개 이상의 데이터 수집기가 1개의 SVM에 연결됩니다.
-
1개의 데이터 수집기가 1개의 SVM에만 연결되도록 합니다.
-
동일한 SVM에 연결된 다른 데이터 수집기를 삭제합니다.
-
-
문제: * 커넥터가 오류 상태입니다. 서비스 이름: 감사. 실패 원인: 구성하지 못했습니다(SVM svmname에 대한 정책). 이유: 'FPolicy.policy의 'shares-to-include' 요소에 잘못된 값이 지정되었습니다. scope-modify: "Federal" * 시도하십시오. * * 공유 이름은 따옴표 없이 지정해야 합니다. ONTAP SVM DSC 구성을 편집하여 공유 이름을 수정하십시오.
_INCLUDE 및 EXCLUDE_는 긴 공유 이름 목록에 사용할 수 없습니다. 포함 또는 제외할 공유 수가 많은 경우 대신 볼륨별 필터링을 사용합니다.
-
문제: * 클러스터에 사용되지 않는 기존 fpolicies가 있습니다. 워크로드 보안을 설치하기 전에 이러한 작업을 어떻게 해야 합니까? *이 방법을 시도해 보십시오. * 연결이 끊긴 상태라도 기존의 사용되지 않는 FPolicy 설정을 모두 삭제하는 것이 좋습니다. 워크로드 보안에서는 접두사 "cloudsecure_"를 사용하여 FPolicy를 생성합니다. 사용되지 않는 다른 모든 FPolicy 구성은 삭제할 수 있습니다.
FPolicy 목록을 표시하는 CLI 명령:
fpolicy show FPolicy 구성을 삭제하는 단계:
fpolicy disable -vserver <svmname> -policy-name <policy_name> fpolicy policy scope delete -vserver <svmname> -policy-name <policy_name> fpolicy policy delete -vserver <svmname> -policy-name <policy_name> fpolicy policy event delete -vserver <svmname> -event-name <event_list> fpolicy policy external-engine delete -vserver <svmname> -engine-name <engine_name>
-
문제: * 데이터 수집기가 오류 상태입니다. 이 오류 메시지를 표시합니다. "오류: 커넥터가 오류 상태입니다. 서비스 이름: 감사. 실패 원인: SVM svm_test에서 정책을 구성하지 못했습니다. 이유: ZAPI 필드에 값이 없습니다. 이벤트 "* 이것을 시도하십시오:*
-
NFS 서비스만 구성하여 새로운 SVM으로 시작하십시오.
-
워크로드 보안에서 ONTAP SVM 데이터 수집기 추가 CIFS는 SVM을 위한 허용 프로토콜로 구성된 동시에 워크로드 보안에서 ONTAP SVM Data Collector를 추가합니다.
-
워크로드 보안의 데이터 수집기에 오류가 표시될 때까지 기다립니다.
-
SVM에 CIFS 서버가 구성되어 있지 않으므로 왼쪽에 표시된 이 오류는 워크로드 보안으로 표시됩니다.
-
ONTAP SVM 데이터 수집기를 편집하고 CIFS를 허용된 프로토콜로 선택 취소하십시오. 데이터 수집기를 저장합니다. NFS 프로토콜만 활성화된 상태에서 실행됩니다.
-
-
문제: * 데이터 수집기는 오류 메시지를 표시합니다: "오류: 2회 재시도 내에 수집기의 상태를 확인하지 못했습니다. 수집기를 다시 시작하십시오(오류 코드: AGENT008)". * 사용해 보세요. *
-
데이터 수집기 페이지에서 오류가 있는 데이터 수집기의 오른쪽으로 스크롤한 다음 3개의 점 메뉴를 클릭합니다. 편집 _ 을(를) 선택합니다. 데이터 수집기의 암호를 다시 입력합니다. Save _ 버튼을 눌러 데이터 수집기를 저장합니다. Data Collector가 다시 시작되고 오류가 해결되어야 합니다.
-
Agent 시스템에 CPU 또는 RAM 여유 공간이 충분하지 않을 수 있으므로 DSC가 실패합니다. 시스템의 에이전트에 추가되는 데이터 수집기 수를 확인하십시오. 20개를 초과하는 경우 Agent 시스템의 CPU 및 RAM 용량을 늘리십시오. CPU와 RAM이 증가되면 DSC가 초기화 중 상태로 전환되었다가 자동으로 실행 상태로 전환됩니다. 에서 사이징 가이드를 "이 페이지"살펴봅니다.
-
-
문제: * SVM 모드가 선택되었을 때 Data Collector에서 오류가 발생했습니다. * 다음을 시도하십시오. * SVM 모드에서 연결하는 동안 SVM 관리 IP 대신 클러스터 관리 IP를 사용하여 연결하면 연결 오류가 발생합니다. 올바른 SVM IP를 사용하는지 확인하십시오.
-
문제: * 액세스 거부 기능이 활성화된 경우 데이터 수집기에 오류 메시지가 표시됩니다. "커넥터가 오류 상태입니다. 서비스 이름: 감사. 실패 이유: SVM test_svm에서 FPolicy를 구성하지 못했습니다. 사유: 사용자가 승인되지 않았습니다." 이 방법을 시도해 보십시오: 사용자에게 액세스 거부 기능에 필요한 REST 권한이 없을 수 있습니다. 의 지침에 따라 "이 페이지"권한을 설정하십시오.
권한이 설정되면 수집기를 다시 시작합니다.
그래도 문제가 발생하면 * 도움말 > 지원 * 페이지에 나와 있는 지원 링크를 참조하십시오.