ONTAP SVM 資料收集器疑難排解
「工作負載安全性」使用資料收集器從裝置收集檔案和使用者存取資料。您可以在此找到疑難排解此收集器問題的秘訣。
如需設定此收集器的說明、請參閱"設定 SVM Collector"頁面。
疑難排解
下表說明已知問題及其解決方法。
發生錯誤時、請按一下「_Status」(狀態)欄中的「_Mor詳細 資料」、以取得錯誤的詳細資料。
問題: | 解決方法: |
---|---|
資料收集器會執行一段時間、並在隨機時間後停止、失敗時顯示:「錯誤訊息:連接器處於錯誤狀態。服務名稱:稽核。故障原因:外部fpolicy伺服器過載。" |
來自於此的事件率ONTAP 遠高於值機員方塊所能處理的事件率。因此連線終止。當中斷連線時、請檢查CloudSecure中的尖峰流量。您可以從* CloudSecure >活動鑑識> All Activ練習*頁面查看。如果尖峰彙總流量高於值機員方塊所能處理的流量、請參閱「事件率檢查器」頁面、瞭解如何在值機員方塊中調整收集器部署的規模。如果代理程式安裝於2021年3月4日之前的Agent方塊中、請在Agent方塊中執行下列命令:回應「net.core。rmem_max = 8388608」>>/etc/syscl.conf回應「net.ipve.tcp_rmem = 40962097152 8388608'>>/etc/syscntl.conf syscl.conf syscp from the collector重新啟動後、重新啟動。 |
Collector會報告錯誤訊息:「在連接器上找不到可連線至SVM資料介面的本機IP位址」。 |
這很可能是ONTAP 因為位在邊上的網路問題。請遵循下列步驟:1.請確定SVM資料LIF或管理LIF上沒有防火牆、無法與SVM連線。2.透過叢集管理 IP 新增 SVM 時,請確保 SVM 的資料 LIF 和管理 LIF 可從 Agent VM 中進行 Ping 。發生問題時、請檢查閘道、網路遮罩和路由以取得LIF。您也可以嘗試使用叢集管理IP透過ssh登入叢集、然後ping代理IP。請確定代理程式IP可調校:_network ping -vserver <vserver name>-destination <Agent IP>-lIF <LIF Name>-show-detail _如果無法調校、請確定ONTAP 位於的網路設定正確無誤、以便代理程式機器可調校。3.如果您嘗試透過叢集 IP 連線,但無法正常運作,請嘗試直接透過 SVM IP 連線。請參閱上述步驟、瞭解透過SVM IP進行連線的步驟。4.透過 SVM IP 和 vsadmin 認證新增收集器時,請檢查 SVM Lif 是否已啟用 Data plus Mgmt 角色。在這種情況下、ping SVM LIF會正常運作、但SSH到SVM LIF則無法運作。如果是、請建立僅限SVM管理LIF、並嘗試透過此SVM管理僅LIF進行連線。5.如果仍無法運作,請建立新的 SVM Lif ,並嘗試透過該 Lif 進行連線。確定子網路遮罩設定正確。6.進階偵錯: A )在 ONTAP 中啟動封包追蹤。 B )嘗試從 CloudSecure UI 將資料收集器連線至 SVM 。 C )等待錯誤出現。在 ONTAP 中停止封包追蹤。 d )從 ONTAP 開啟封包追蹤。此網站位於以下位置: __https : //spi/spi/etc/log/packet_stalles/_e ),請確定 ONTAP 到值機員方塊有一個 SYN.F )如果 ONTAP ONTAP 沒有 SYN, 則 <clustername> ONTAP 中的防火牆會發生問題。 g )在 ONTAP 中開啟防火牆,讓 <cluster_mgmt_ip> 能夠連線到值機員方塊。7.如果仍無法運作,請諮詢網路團隊,確定沒有外部防火牆封鎖從 ONTAP 到值機員信箱的連線。8.確認連接埠 7 已開啟。9.如果上述任何一項都無法解決問題,請開啟案例"NetApp支援"以取得進一步協助。 |
訊息:「無法判斷ONTAP [hostname:<IP Address>的資訊類型。原因:連線錯誤至儲存系統<IP位址>:主機無法連線(主機無法連線)" |
1.確認已提供正確的 SVM IP 管理位址或叢集管理 IP 。2.SSH 連接至 SVM 或您要連線的叢集。連線後、請確認SVM或叢集名稱正確無誤。 |
錯誤訊息:「連接器處於錯誤狀態。service.name:稽核。故障原因:外部fpolicy伺服器已終止。" |
1.防火牆很可能會封鎖代理機器中的必要連接埠。確認已開啟連接埠範圍35000-55000/TCP、讓代理機器從SVM連線。此外、請確保ONTAP 沒有啟用任何防火牆、從「邊」封鎖與代理機器的通訊。2.在 Agent (代理)框中鍵入以下命令,確保端口範圍已打開。_Sudo iptarts-SAVE |
Grep 3500*範例輸出應如下所示:A in_public_allow -p tcp -m tcp -dport 35000 -m conntrack -ctst態new -j Accept_3。登入SVM、輸入下列命令、並檢查是否未設定任何防火牆來封鎖與ONTAP 之通訊。 系統服務防火牆顯示 _ _ 系統服務防火牆原則顯示 _ "檢查防火牆命令" 在 ONTAP 端。4.SSH 至您要監控的 SVM/ 叢集。從SVM資料LIF Ping Agent Box(支援CIFS、NFS傳輸協定)、並確保ping正常運作: _network ping -vserver <vserver name>-destination <Agent ip>-lIF <LIF Name>-show-detect_如果無法ping通、請確定ONTAP 支援更新的網路設定正確、以便代理機器能夠ping通。如果透過2個資料收集器將單一SVM新增兩次至租戶、則會顯示此錯誤。透過UI刪除其中一個資料收集器。然後透過UI重新啟動其他資料收集器。然後資料收集器會顯示「執行中」狀態、並開始接收來自SVM的事件。基本上、在租戶中、只能透過1個資料收集器新增1個SVM。1 SVM不應透過2個資料收集器新增兩次。6.如果在兩個不同的工作負載安全環境(租戶)中新增相同的 SVM ,最後一個將永遠成功。第二個收集器會使用自己的IP位址來設定fpolicy、然後啟動第一個。因此第一個收集器將停止接收事件、其「稽核」服務將進入錯誤狀態。若要避免這種情況發生、請在單一環境中設定每個SVM。7.如果服務原則設定不正確,也可能發生此錯誤。使用支援支援支援功能的支援功能9.8或更新版本時、若要連線至資料來源收集器、則需要資料服務資料服務、例如NFS和/或資料- CIFS、以提供資料- fpolice-Client服務ONTAP 。此外、資料fpolice-Client服務必須與受監控SVM的資料LIF相關聯。 |
活動頁面未顯示任何事件。 |
1.檢查 ONTAP 收集器是否處於「執行中」狀態。如果是、請開啟部分檔案、確保CIFS用戶端VM上產生部分CIFS事件。2.如果看不到任何活動,請登入 SVM 並輸入下列命令。<SVM>EVENT log show -SOURSfpolicy_Please ensure that are no errors related to fpolicy(事件日誌顯示-SOURSfpolicy_請 確保沒有與fpolicy相關的錯誤)。3.如果看不到任何活動,請登入 SVM 。輸入下列命令:<SVM>fpolicy show_檢查是否已設定名為「clouded_」的fpolicy原則、且狀態為「on」。如果未設定、則代理程式很可能無法在SVM中執行命令。請確認已遵循頁面開頭所述的所有先決條件。 |
SVM Data Collector處於錯誤狀態、錯誤訊息為「代理程式無法連線至收集器」 |
1.代理程式很可能超載,無法連線至資料來源收集器。2.檢查有多少資料來源收集器連線至 Agent 。3.同時在 UI 的「 All Activity) 」頁面中檢查資料流率。4.如果每秒的活動數量相當高,請安裝另一個 Agent ,並將部分資料來源收集器移至新的 Agent 。 |
SVM Data Collector會顯示錯誤訊息「fpolicy.server.connectError: Node失敗、無法與FPolicy伺服器建立連線:12.195.15.146」(原因:「Select Timed Out」(選擇逾時)) |
在SVM/叢集中啟用防火牆。因此fpolicy引擎無法連線至fpolicy伺服器。可用於取得更多資訊的CLI包括:事件記錄檔show -SOUR叢fpolicy、其中顯示錯誤事件記錄檔show -source fpolicy -功能 變數事件、行動、說明、其中顯示更多詳細資料。ONTAP"檢查防火牆命令"在 ONTAP 側。 |
錯誤訊息:「Connector處於錯誤狀態。服務名稱:稽核。故障原因:SVM上找不到有效的資料介面(角色:資料、資料傳輸協定:NFS或CIFS或兩者、狀態:UP)。」 |
確保有作業介面(做為CIFS/NFS的資料和資料傳輸協定角色)。 |
資料收集器會進入「錯誤」狀態、然後在一段時間後進入「執行中」狀態、然後再次返回「錯誤」。此週期會重複。 |
這通常發生在下列案例中:1.新增多個資料收集器。2.顯示這類行為的資料收集器將會在這些資料收集器中新增 1 個 SVM 。表示2個以上的資料收集器連接至1個SVM。3.確保只有 1 個資料收集器連線至 1 個 SVM 。4.刪除連接至同一個 SVM 的其他資料收集器。 |
連接器處於錯誤狀態。服務名稱:稽核。失敗原因:無法設定(SVM svmname上的原則。原因:在'fpolicy.policy.scoe-modify:"felf"中為「res-to -include'元素指定的值無效 |
共用名稱必須在沒有任何報價的情況下提供。編輯ONTAP 「SVM DSC」組態以修正共用名稱。_包括和排除共享_不適用於長清單的共享區名稱。如果您要納入或排除大量共用、請改用依磁碟區篩選。 |
叢集中有未使用的現有fPolicies。在安裝工作負載安全性之前、應該如何處理這些問題? |
建議刪除所有現有未使用的fpolicy設定、即使它們處於中斷連線狀態。「工作負載安全性」會以「cloudseced_」開頭的字元建立fpolicy。可以刪除所有其他未使用的fpolicy組態。用於顯示fpolicy清單的CLI命令:_fpolicy show_刪除fpolicy組態的步驟:_fpolicy disable-vserver <svmname>-police-name <policy_name>_fpolicy刪除-vserver <svmname>-policy_name>-policy_name <policy_name_vpolicy <vmname -policy -vms_delete policy -policy <vpolicy -name_external policy -name> |
啟用工作負載安全功能後ONTAP 、效能表現會受到影響:延遲偶爾會變得很高、IOP偶爾會變得很低。 |
使用 ONTAP 搭配工作負載安全功能時、 ONTAP 有時會出現延遲問題。有許多可能的原因如下所述:"1372994", "1415152",, "1438207", "1479704" "1354659"。所有這些問題都已在 ONTAP 9.13.1 及更新版本中修正、強烈建議您使用這些更新版本之一。 |
資料收集器發生錯誤、顯示此錯誤訊息。「錯誤:連接器處於錯誤狀態。服務名稱:稽核。失敗原因:無法在SVM SVM_TEST上設定原則。原因:缺少ZAPI欄位值:事件。「 |
從只設定NFS服務的新SVM開始著手。在ONTAP 工作負載安全性中新增一個功能不全的SVM資料收集器。CIFS被設定為SVM允許的傳輸協定、同時在ONTAP 工作負載安全性中加入SVM Data Collector。等到工作負載安全性中的資料收集器顯示錯誤。由於未在SVM上設定CIFS伺服器、因此工作負載安全性會顯示左圖所示的錯誤。編輯ONTAP 《SVM資料收集器》、並視允許的傳輸協定取消CIFS檢查。儲存資料收集器。它會在僅啟用NFS傳輸協定的情況下開始執行。 |
資料收集器會顯示錯誤訊息:「錯誤:無法在2次重試中判斷收集器的健全狀況、請再次嘗試重新啟動收集器(錯誤代碼:AGENT008)」。 |
1.在「資料收集器」頁面上、捲動至資料收集器右側、顯示錯誤訊息、然後按一下「3點」功能表。選取_編輯_。再次輸入資料收集器的密碼。按下「Sav_」按鈕以儲存資料收集器。資料收集器會重新啟動、錯誤應該會解決。2.Agent 機器可能沒有足夠的 CPU 或 RAM 保留空間,這就是 DSC 故障的原因。請檢查新增至機器代理程式的資料收集器數量。如果超過20個、請增加代理機器的CPU和RAM容量。CPU和RAM增加之後、DSC就會進入初始化、然後自動進入執行狀態。請參閱上的尺寸調整指南"本頁"。 |
選取 SVM 模式時, Data Collector 會發生錯誤。 |
如果您仍遇到問題、請聯絡*「說明」>「支援*」頁面中提及的支援連結。