分析工作负载工厂中的错误日志
使用智能错误日志分析器自动解释 Microsoft SQL Server 和 Oracle 数据库错误日志,以便您可以快速识别和解决问题。Agentic AI 为基础的分析需要 Amazon Bedrock 集成。
关于此任务
错误日志分析和修复有助于维护 SQL Server 实例和 Oracle 数据库的健康状况和性能。有效解读错误日志需要仔细分析和专业知识。手动监控、错误检测和根本原因分析非常耗时,而且容易出错。这些挑战可能会延迟问题解决、增加停机时间并导致运营效率低下。智能错误日志分析器通过以下主要优势应对了这些挑战:
-
智能分组:根据唯一性、严重性和类别智能地合并错误,并简化故障排除过程,以便更快、更有效地解决问题。
-
人工智能驱动的调查:利用人工智能主动分析错误,提供清晰、可操作的见解,以加速问题识别,而无需深厚的专业知识。
-
错误丰富:通过外部引用增强错误日志,提供清晰的上下文以提高理解和决策。
-
最佳实践补救:为在 FSx for ONTAP上运行的 SQL Server 工作负载提供定制的补救建议,使各种技能水平的用户都能自信地解决问题。
无论何时使用错误日志分析器,您都可以完全控制您的环境,同时受益于先进的 AI 分析。
要使用错误日志分析器,您需要激活 Amazon Bedrock、选择 Workload Factory 使用的模型、创建私有端点以连接到 Amazon Bedrock、添加权限并创建企业许可证。
数据隐私和安全
该功能通过以下措施确保数据隐私和安全:
日志数据和聚合保留在您的 AWS 帐户内,通过私有 VPC 端点(Amazon Bedrock)进行通信,确保不会暴露在公共互联网上。
客户数据不用于训练或改进模型。 Amazon Bedrock 实时处理日志,但不会对您的数据进行训练。结果存储在您的环境中仅供参考。欲了解更多详情,请参阅"Amazon Bedrock 数据保护文档"。
开始之前
要使用错误日志分析器,您必须满足以下先决条件:
-
你必须 "授予_查看、规划和分析_权限" 在您的 AWS 账户中,在 Workload Factory 中创建一个新的数据库主机。
-
"注册资源"在工作负载工厂中。
-
还必须满足以下先决条件。作为分析日志错误的步骤的一部分,系统将提示您完成这些先决条件。
-
Amazon Bedrock 激活
要使 Workload Factory 中运行在 SQL Server 或 Oracle 主机上的 AI 代理能够无缝连接到 Bedrock 并获取已识别错误日志的 AI 见解,就需要 Amazon Bedrock。
-
联网
Amazon Bedrock VPC 端点可确保您的 SQL Server 或 Oracle 主机与 Amazon Bedrock API 进行私密通信,并消除公共互联网暴露。确保 Amazon Bedrock VPC 端点与 SQL Server 或 Oracle 主机的子网关联(例如:vpce-050cb2f33a1380ffd)。
-
AWS IAM 权限
以下权限是与 SQL Server 或 Oracle 主机关联的 EC2 实例配置文件角色以及与 Workload Factory 关联的 AWS 凭证所必需的。
-
具有“bedrock:InvokeModel”权限的 EC2 实例配置文件角色
此权限允许相应的 SQL Server 或 Oracle 主机上的 EC2 实例调用 Bedrock 模型,以便主动进行错误调查和补救指导。该配置文件还能确保安全地访问人工智能,从而提供定制化的洞察。
-
与 Workload Factory 关联的 AWS 凭证:“bedrock:GetFoundationModelAvailability”和“bedrock:ListInferenceProfiles”权限
这些权限验证 SQL Server 或 Oracle 主机所在区域的模型可用性和配置,并确保可靠的、特定于区域的性能。
-
-
Oracle 用户权限
以下权限授予对扩展诊断警报的读取访问权限,从而可以从日志中提取错误/跟踪详细信息,以进行 AI 驱动的模式检测和修复:
V$DIAG_ALERT_EXT。此权限仅适用于 Oracle 数据库。
-
分析错误日志
使用 Workload Factory 控制台分析 SQL Server 错误日志。
-
使用其中一个登录"控制台体验"。
-
在数据库磁贴中,选择*转至数据库清单*。
-
从数据库菜单中,选择*Inventory*。
-
在“清单”中,选择“Microsoft SQL Server”或“Oracle”作为数据库引擎类型。
-
在“实例”选项卡中,找到要分析的特定 SQL Server 实例或 Oracle 数据库,然后从菜单中选择“调查错误”。
-
从“错误调查”选项卡中,按照控制台中的说明完成以下先决条件:
-
亚马逊基岩
-
网络:Amazon Bedrock 的私有终端节点
-
EC2 实例配置文件角色的权限
-
与工作负载数据库管理 (wlmdb) 相关的凭证
-
-
当满足先决条件时,选择*立即调查*以使用错误日志分析器深入了解您的 SQL Server 错误日志。
扫描完成后,错误会显示在控制台中,提供智能错误日志分析器检测到的问题的全面视图。
-
使用过滤器,根据严重性、时间范围和错误代码等标准,或根据面向基础架构的标签(例如计算、存储、网络和安全)来筛选显示的错误。
-
查看详细的错误信息,包括原始错误消息、基于 AI 的解释以及解决错误的建议补救步骤。