Skip to main content
Enterprise applications
本繁體中文版使用機器翻譯,譯文僅供參考,若與英文版本牴觸,應以英文版本為準。

Oracle Real Application Clusters ( RAC )逾時

貢獻者

Oracle RAC 是一款叢集軟體產品、內含多種類型的內部活動訊號處理程序、可監控叢集的健全狀況。

註 中的資訊 "遺失計數" 本節包含使用網路儲存設備的 Oracle RAC 環境的重要資訊、在許多情況下、需要變更預設 Oracle RAC 設定、以確保 RAC 叢集在網路路徑變更和儲存設備容錯移轉 / 切換作業之後仍能順利運作。

磁碟逾時

主要儲存相關 RAC 參數為 disktimeout。此參數控制投票檔案 I/O 必須完成的臨界值。如果是 disktimeout 超過參數、 RAC 節點就會從叢集中移出。此參數的預設值為 200 。此值應足以用於標準儲存設備接管和恢復程序。

NetApp 強烈建議您在將 RAC 組態投入生產之前、先徹底測試這些組態、因為許多因素會影響接管或恢復作業。除了完成儲存容錯移轉所需的時間之外、連結集合化控制傳輸協定( LACP )變更也需要額外的時間才能傳播。此外、 SAN 多重路徑軟體必須偵測 I/O 逾時、然後在替代路徑上重試。如果資料庫處於極活躍狀態、則必須在處理投票磁碟 I/O 之前、先佇列並重新嘗試大量 I/O 。

如果無法執行實際的儲存接管或恢復、則可以在資料庫伺服器上進行纜線拉出測試來模擬影響。

提示
  • NetApp 建議 * 下列事項:

  • 離開 disktimeout 預設值為 200 的參數。

  • 務必徹底測試 RAC 組態。

遺失計數

misscount 參數通常只會影響 RAC 節點之間的網路心跳。預設值為 30 秒。如果網格二進位檔位於儲存陣列上、或作業系統開機磁碟機不是本機磁碟機、此參數可能會變得很重要。這包括 FC SAN 上具有開機磁碟機的主機、 NFS 開機作業系統、以及位於虛擬化資料存放區(例如 VMDK 檔案)上的開機磁碟機。

如果因儲存接管或恢復而中斷開機磁碟機的存取、網格二進位位置或整個作業系統可能會暫時停止運作。ONTAP 完成儲存作業所需的時間、以及作業系統變更路徑和恢復 I/O 所需的時間、可能會超過 misscount 臨界值。因此、節點會在連線到開機 LUN 或網格二進位檔恢復後立即停止。在大多數情況下、會發生遷離和後續重新開機、而不會出現記錄訊息來指出重新開機的原因。並非所有組態都會受到影響、因此請在 RAC 環境中測試任何 SAN 開機、 NFS 開機或資料存放區型主機、以便在與開機磁碟機的通訊中斷時、 RAC 保持穩定。

非本機開機磁碟機或非本機檔案系統代管的情況 grid 二進位檔案 misscount 需要變更以符合 disktimeout。如果變更此參數、請進行進一步測試、以識別對 RAC 行為的任何影響、例如節點容錯移轉時間。

提示
  • NetApp 建議 * 下列事項:

  • 離開 misscount 參數的預設值為 30 、除非符合下列其中一項條件:

    • grid 二進位檔位於網路附加磁碟機上、包括 NFS 、 iSCSI 、 FC 和資料存放區型磁碟機。

    • 作業系統是 SAN 開機。

  • 在這種情況下、請評估網路中斷對 OS 或的存取造成的影響 GRID_HOME 檔案系統。在某些情況下、這類中斷會導致 Oracle RAC 精靈停止運作、進而導致 misscount`根據的逾時和遷離。逾時預設為 27 秒、即的值 `misscount 減號 reboottime。在這種情況下、請增加 misscount 200 比對 disktimeout