自动支持监控
AutoSupport 监控 Astra 数据存储系统运行时间和信息,并向 NetApp 支持部门发送消息。根据您的配置,可以监控以下系统组件:
-
控制面板
-
存储
默认情况下,期间会启用 AutoSupport "Astra Data Store 集群安装" 或在将 AutoSupport 自定义资源( CR )应用于集群后。启用后, AutoSupport ( ASUP )捆绑包将自动上传到 "NetApp 支持站点( NSS )" 或可供手动下载。
AutoSupport 触发器和场景
AutoSupport 捆绑包可通过以下方式触发:
-
* 定期 * : ASUP 捆绑包按 CR 中定义的间隔创建。
-
* 用户触发 * :您可以手动创建自己的 ASUP 以查看日志。
-
* 核心转储 * :如果节点上存在核心转储,则会生成 ASUP ,并将核心发送给 NetApp 进行进一步调查。
-
* 基于 CallHome 事件 * :从操作系统的特定 CallHome 事件生成 ASUP 。
-
* 基于 Kubernetes 事件 * :从控制平面中的特定 Kubernetes 事件生成 ASUP 。
这些触发情形会生成以下 AutoSupport 类型之一:
-
控制平面CRS:一组AutoSupport 数据存储控制平面日志和。
-
* 存储 AutoSupport * :存储报告和性能数据的集合。
-
* 核心转储 AutoSupport * :系统核心转储的集合。
配置自定义控制平面 AutoSupport 收集
您可以创建一个自定义 AutoSupport 收集配置,用于报告控制平面事件。默认情况下,大多数安装都已在期间启用定期事件报告 "Astra Data Store 集群安装"。此操作步骤介绍如何配置 AutoSupport CR ,以便根据您选择的参数进行报告:
-
自定义以下命令以创建控制面板集合 CR :
kubectl astasds asup collect -c controlplane --namespace=astrads-system
-
定义自定义参数:
-
` <myASUPname>` :要生成的 AutoSupport CR 的名称。
-
` -e < 事件名称 >` :触发收集的事件名称。事件名称应在 component-yaml 中预定义(该名称已挂载到支持控制器)。
示例
-
kubectl astrasds asup collect -c controlplane custom-asup-name -e debug --namespace=astrads-system
-
根据需要为系统添加其他参数:
-
` -cluster` :在多集群环境中需要此标志。
-
` -localCollection` :启用本地收集。默认值为
false
。 -
` -forceUpload` :启用强制上传。默认值为
false
。 -
` — retry` :启用重试。默认值为
false
。
-
-
配置自定义 Storage AutoSupport 收集
您可以创建自定义 AutoSupport 收集配置,以报告存储组件事件。默认情况下,大多数安装都已在期间启用定期事件报告 "Astra Data Store 集群安装"。此操作步骤介绍如何配置 AutoSupport CR ,以便根据您选择的参数进行报告:
-
自定义以下命令以创建存储收集 CR :
kubectl astrasds asup collect -c storage --namespace=astrads-system
-
定义自定义参数:
-
` <myASUPname>` :要生成的 AutoSupport CR 的名称。
-
` -e < 事件名称 >` :触发收集的事件名称。事件名称应在 component-yaml 中预定义(该名称已挂载到支持控制器)。
性能事件示例:
-
kubectl-astrads asup collect -c storage -e performance example-perf-storage-asup
-
` -t <ISO_format> -d <hours>` :在指定的持续时间内为所有节点收集存储 ASUP 。请使用标准 ISO 日期时间格式(` -t` ),持续时间(
D
)以小时为单位。例如:kubectl astrads asup collect -c storage -t 2021-01-01T15:00:00Z -d 24
-
` -nodes < 节点名称 >` :为指定节点收集存储 ASUP 。例如:
kubectl astrads asup collect -c storage --nodes example1
-
` -nodes nodename1 , nodeame2 , nodeame3` :为指定节点收集存储 ASUP :
kubectl astrads asup collect -c storage --nodes example1,example2,example3
-
根据需要为系统添加其他参数:
-
-
` -cluster` :在多集群环境中需要此标志。
-
` -localCollection` :启用本地收集。默认值为
false
。 -
` -forceUpload` :启用强制上传。默认值为
false
。 -
` — retry` :启用重试。默认值为
false
。
-
列出系统中的 ASUP
使用以下命令按名称列出系统中的 ASUP :
kubectl astrasds asup list --namespace=astrads-system
响应示例:
NAMESPACE NAME SEQUENCE NUMBER EVENT SIZE STATE LOCAL COLLECTION astrads-system storage-callhome.reboot.unknown-... 1 callhome.reboot.unknown 0 uploaded astrads-ds-support-tdl2h: astrads-system storage-callhome.reboot.unknown-... 2 callhome.reboot.unknown 0 uploaded astrads-ds-support-xx6n8: astrads-system storage-callhome.reboot.unknown-... 3 callhome.reboot.unknown 0 uploaded astrads-ds-support-qghnx:
下载 ASUP 捆绑包
您可以使用此命令下载本地收集的 ASUP 捆绑包。使用 ` -o < 位置 >` 指定当前工作目录以外的位置:
./kubectl-astrasds asup download <ASUP_bundle_name> -o <location>
上传核心文件
如果服务崩溃,则会创建 AutoSupport ( ASUP )消息以及崩溃时包含相关内存内容的文件(称为核心文件)。Astra Data Store会自动将ASUP消息上传到NetApp支持部门、但您需要手动上传核心文件、以便它与ASUP消息相关联。
-
使用以下
kubectl
命令查看 ASUP 消息:kubectl astrasds asup list --namespace=astrads-system
您应看到类似于以下内容的输出:
NAMESPACE NAME SEQUENCE NUMBER EVENT SIZE STATE LOCAL COLLECTION astrads-system storage-coredump-2021... 1 coredump 197848373 compressed astrads-ds-support-sxxn7:/var/...
-
使用以下
kubectl
命令从 ASUP 消息中下载核心文件。使用 ` -o` 选项为下载的文件指定目标目录。kubectl astrads asup download storage-coredump-20211216t140851311961680 -o <absolute_path_to_destination_directory>
在极少数情况下,您可能无法下载核心文件,因为其他核心文件已取代它。发生这种情况时,命令将返回错误 cannot stat : no such file or directory
。如果您看到此错误,可以 "获取帮助"。 -
打开 Web 浏览器并浏览到 "NetApp 身份验证文件上传工具",如果您尚未登录,请输入您的 NetApp 支持凭据。
-
选中 * 我没有案例编号 * 复选框。
-
在 * 最近的区域 * 菜单中,选择最接近您的区域。
-
选择 * 上传 * 按钮。
-
浏览并选择先前下载的核心文件。
此时将开始上传。上传完成后,将显示一条成功消息。