Skip to main content
Cloud Insights
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

排除 Linux 上的采集单元问题

贡献者

您可以在此处找到有关排除 Linux 服务器上采集单元问题的建议。

* 问题: *

* 请尝试此操作: *

采集单元*选项卡中的*Observability > Collectors*页面上的AU状态显示“证书已过期”或“证书已撤销”。

单击 AU 右侧的菜单,然后选择 * 还原连接 * 。按照说明还原采集单元: 1.停止采集单元( Acquisition Unit , AU )服务。您可以单击 Copy Stop Command 按钮将命令快速复制到剪贴板,然后将此命令粘贴到采集单元计算机上的命令提示符中。2. 在 AU 上的 /var/lib/netapp/cloudinsides/acq/conf_ 文件夹中创建一个名为 "token" 的文件。3. 单击 Copy Token 按钮,然后将此令牌粘贴到您创建的文件中。4. 重新启动 AU 服务。单击 Copy Restart Command 按钮,然后将命令粘贴到 AU 上的命令提示符中。

启动采集单元服务器服务时权限被拒绝

当AU安装在SELinux上时、应将SE设置为_permisent_模式。不支持_Enforcerent_模式。将SELinux设置为许可模式后、重新启动AU服务。 "了解更多信息。"

未满足服务器要求

确保您的采集单元服务器或虚拟机满足要求 "要求"

未满足网络要求

确保您的采集单元服务器 /VM 可以通过端口 443 通过 SSL 连接访问 Cloud Insights 环境( <environment-name>.c01.cloudinsights.netapp.com )。尝试以下命令: ping <environment-name>.c01.cloudinsights.netapp.com traceroute <environment-name>.c01.cloudinsights.netapp.com curl https://<environment-name>.c01.cloudinsights.netapp.com wget https://<environment-name>.c01.cloudinsights.netapp.com

代理服务器配置不正确

验证代理设置,并根据需要卸载 / 重新安装采集单元软件以输入正确的代理设置。1. 尝试 "curt" 。有关代理的信息 / 文档请参见 "man curle" : -preproxy , -proxy-* (这是通配符 "*" ,因为 cURL 支持多种代理设置)。2. 尝试 "wget" 。有关代理选项,请查看文档。

启动采集服务时, Cloud Insights 中的采集单元安装失败,并显示凭据错误(在 acq.log 中可见)。

这可能是由于代理凭据中包含特殊字符所致。卸载 AU ( sudo cloudinsors-uninstall.sh )并重新安装,而不使用特殊字符。

Linux :缺少库 / 未找到文件

确保 Linux 采集单元服务器 /VM 具有所有必要的库。例如,您必须在服务器上安装 _unzip 库。要安装 _unzip 库,请在运行采集单元安装脚本之前运行命令 _* sudo yum install unzip * _

权限问题

请确保您以具有 _sudo 权限的用户身份登录

采集未运行:

从 /opt/netapp/cloudinsents/acq/logs ( Linux )收集 acq.log 重新启动采集服务: sudo cloudinsights-service.sh restart acquisition

数据收集问题:

单击 " 发送错误报告 " 按钮,从 Data Collector 登录页面发送错误报告

状态:检测信号失败

采集单元( Acquisition Unit , AU )每 60 秒向 Cloud Insights 发送一次检测信号,以便续订租约。如果检测信号调用因网络问题描述或 Cloud Insights 无响应而失败,则不会更新 AU 的租用时间。当 AU 的租约时间到期时, Cloud Insights 将显示 "Heartbeat Failed" 状态。故障排除步骤:检查采集单元服务器与 CloudInsights 之间的网络连接。检查采集单元服务是否正在运行。如果此服务未运行,请启动此服务。检查采集单元日志( /var/log/netapp/cloudinsides/acq/acq.log )以查看是否存在任何错误。

我看到一条 " 检测信号错误:消息

如果网络中断导致采集单元与 Cloud Insights 环境之间的通信中断一分钟以上,则可能会发生此错误。验证 AU 和 Cloud Insights 之间的连接是否稳定且处于活动状态。

有关 Proxies 和防火墙的注意事项

如果您的组织需要使用代理来访问 Internet ,则您可能需要了解您的组织的代理行为并寻求某些例外情况, Cloud Insights 才能正常工作。请记住以下几点:

  • 首先,贵组织是否默认阻止访问,并且例外情况下仅允许访问特定网站 / 域?如果是,则需要将以下域添加到异常列表中:

    *.cloudinsights.netapp.com

    您的 Cloud Insights 采集单元以及您在 Web 浏览器中与 Cloud Insights 的交互都将转到具有该域名的主机。

  • 其次,某些代理尝试使用未从 NetApp 生成的数字证书模拟 Cloud Insights 网站来执行 TLS/SSL 检查。Cloud Insights 采集单元的安全模式从根本上与这些技术不兼容。为了使 Cloud Insights 采集单元成功登录到 Cloud Insights 并便于数据发现,您还需要除此功能之外的上述域名。

如果为流量检查设置了代理,则必须将 Cloud Insights 环境添加到代理配置中的例外列表中。此例外列表的格式和设置因代理环境和工具而异,但通常您必须将 Cloud Insights 服务器的 URL 添加到此例外列表中,以便 AU 能够与这些服务器正确通信。

执行此操作的最简单方法是将 Cloud Insights 域本身添加到异常列表:

 *.cloudinsights.netapp.com
如果未设置代理来进行流量检查,则可能需要或不需要例外列表。如果您不确定是否需要将 Cloud Insights 添加到例外列表中,或者由于代理和 / 或防火墙配置而在安装或运行 Cloud Insights 时遇到困难,请与您的代理管理团队联系,设置代理对 SSL 截获的处理方式。

查看代理端点

在入职期间选择数据收集器时,您可以单击 * 代理设置 * 链接,或者单击 * 帮助 > 支持 * 页面上 _ 代理设置 _ 下的链接来查看代理端点。此时将显示如下表。如果您的环境中具有工作负载安全性、则已配置的端点URL也会显示在此列表中。

代理端点表

资源

有关其他故障排除提示,请参见 "NetApp 知识库" (需要支持部门登录)。

有关其他支持信息,请参见 Cloud Insights "支持" 页面。