分析工作負載工廠中的錯誤日誌
使用智慧型錯誤日誌分析器自動解釋 Microsoft SQL Server 錯誤日誌,以便您可以快速識別和解決問題。Agentic AI 為基礎的分析需要 Amazon Bedrock 整合。
關於這項工作
錯誤日誌分析和補救有助於維護 SQL Server 執行個體的健康和效能。有效地解釋 SQL Server 錯誤日誌需要仔細的分析和專業知識。手動監控、錯誤偵測和根本原因分析非常耗時,而且容易出錯。這些挑戰可能會延遲問題解決、增加停機時間並導致營運效率低落。智慧錯誤日誌分析器透過以下主要優勢解決了這些挑戰:
-
智慧分組:根據唯一性、嚴重性和類別智慧地合併錯誤,並簡化故障排除過程,以便更快、更有效地解決問題。
-
人工智慧驅動的調查:利用人工智慧主動分析錯誤,提供清晰、可操作的見解,以加速問題識別,而無需深厚的專業知識。
-
錯誤豐富:透過外部引用增強錯誤日誌,提供清晰的上下文以提高理解和決策。
-
最佳實務補救:為在 FSx for ONTAP上執行的 SQL Server 工作負載提供客製化的補救建議,使各種技能等級的使用者都能自信地解決問題。
無論何時使用錯誤日誌分析器,您都可以完全控制您的環境,同時受益於先進的 AI 分析。
要使用錯誤日誌分析器,您需要啟動 Amazon Bedrock、選擇 Workload Factory 使用的模型、建立私有端點以連接到 Amazon Bedrock、新增權限並建立企業授權。
資料隱私和安全
此功能透過以下措施確保資料隱私和安全:
日誌資料和聚合保留在您的 AWS 帳戶內,透過私有 VPC 端點(Amazon Bedrock)進行通信,確保不會暴露在公共互聯網上。
客戶資料不用於訓練或改進模型。 Amazon Bedrock 即時處理日誌,但不會對您的資料進行訓練。結果儲存在您的環境中僅供參考。如欲了解更多詳情,請參閱"Amazon Bedrock 資料保護文檔"。
開始之前
要使用錯誤日誌分析器,您必須滿足以下先決條件:
-
你必須有"AWS 帳戶憑證和讀取/寫入模式權限"在 Workload Factory 中建立一個新的資料庫主機。
-
"註冊 SQL Server 實例"在工作負載工廠中。
-
也必須滿足以下先決條件。作為分析日誌錯誤的步驟的一部分,系統將提示您完成這些先決條件。
-
Amazon Bedrock 啟動
需要 Amazon Bedrock,以便在 Workload Factory 的 SQL 節點上執行的 AI 代理可以無縫連接 Bedrock 並為已識別的錯誤日誌取得基於 AI 的見解。
-
聯網
Amazon Bedrock VPC 端點可確保您的 SQL 節點與 Amazon Bedrock API 進行私密通信,並消除公共網路暴露。確保 Amazon Bedrock VPC 端點與 SQL Server 節點的子網路相關聯(例如:vpce-050cb2f33a1380ffd)。
-
AWS IAM 權限
與 SQL 節點關聯的 EC2 執行個體設定檔角色以及與 Workload Factory 關聯的 AWS 憑證需要下列權限。
-
具有“bedrock:InvokeModel”權限的 EC2 實例設定檔角色
此權限使對應 SQL 節點上的 EC2 執行個體能夠呼叫 Bedrock 模型進行主動錯誤調查和補救指導。此設定檔還可確保安全的 AI 存取以獲得客製化的見解。
-
與 Workload Factory 關聯的 AWS 憑證:「bedrock:GetFoundationModelAvailability」和「bedrock:ListInferenceProfiles」權限
這些權限驗證 SQL 節點區域中的模型可用性和配置,並確保可靠的、特定於區域的效能。
-
-
分析錯誤日誌
使用 Workload Factory 控制台分析 SQL Server 錯誤日誌。
-
使用其中一項登"主控台體驗"入。
-
在「資料庫」方塊中、選取 * 前往資料庫庫存 * 。
-
從資料庫選單中,選擇*Inventory*。
-
在清單中,選擇 Microsoft SQL Server 作為資料庫引擎類型。
-
從「實例」標籤中,找到要分析的特定 SQL Server 實例,然後從選單中選擇「調查錯誤」。
-
從「錯誤調查」標籤中,請按照控制台中的說明完成以下先決條件:
-
亞馬遜基岩
-
網路:Amazon Bedrock 的私有終端節點
-
EC2 執行個體設定檔角色的權限
-
與工作負載資料庫管理 (wlmdb) 相關的憑證
-
-
當滿足先決條件時,選擇*立即調查*以使用錯誤日誌分析器深入了解您的 SQL Server 錯誤日誌。
掃描完成後,錯誤會顯示在控制台中,提供智慧錯誤日誌分析器偵測到的問題的全面視圖。
-
使用過濾器根據嚴重性、時間範圍和錯誤代碼等標準來優化顯示的錯誤。
-
查看詳細的錯誤訊息,包括原始錯誤訊息、基於 AI 的解釋以及解決錯誤的建議補救步驟。