Skip to main content
Enterprise applications
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

RACタイムアウト

共同作成者

Oracle RACは、クラスタの健常性を監視する複数のタイプの内部ハートビートプロセスを備えたクラスタウェア製品です。

メモ の情報 "MissCount" セクションには、ネットワーク・ストレージを使用するOracle RAC環境に関する重要な情報が記載されています。多くの場合、RACクラスタがネットワーク・パスの変更やストレージのフェイルオーバー/スイッチオーバー操作に耐えられるように、デフォルトのOracle RAC設定を変更する必要があります。

ディスクタイムアウト

プライマリストレージ関連のRACパラメータはです。 disktimeout。このパラメータは、投票ファイルI/Oが完了しなければならないしきい値を制御します。状況に応じて disktimeout パラメータの値を超えると、そのRACノードがクラスタから削除されます。このパラメータのデフォルトは200です。ストレージのテイクオーバーとギブバックの標準的な手順では、この値で十分です。

テイクオーバーやギブバックには多くの要素が影響するため、NetAppでは、RAC構成を本番環境に導入する前に徹底的にテストすることを強く推奨します。ストレージフェイルオーバーの完了に必要な時間に加えて、Link Aggregation Control Protocol(LACP;リンクアグリゲーション制御プロトコル)の変更が伝播されるまでの時間も長くなります。また、SANマルチパスソフトウェアはI/Oタイムアウトを検出し、代替パスで再試行する必要があります。データベースが非常にアクティブな場合は、投票ディスクI/Oが処理される前に、大量のI/Oをキューに入れて再試行する必要があります。

ストレージのテイクオーバーやギブバックを実際に実行できない場合は、データベースサーバでケーブルを取り外すテストを実行して影響をシミュレートできます。

ヒント
  • NetAppの推奨事項*:

  • を終了します。 disktimeout パラメータを指定します。デフォルト値は200です。

  • RAC構成は常に十分にテストしてください。

MissCount

misscount パラメータは通常、RACノード間のネットワークハートビートにのみ影響します。デフォルトは30秒です。Gridバイナリがストレージアレイ上にある場合やOSのブートドライブがローカルでない場合は、このパラメータが重要になることがあります。これには、ブートドライブがFC SANに配置されたホスト、NFSブートOS、およびVMDKファイルなどの仮想データストアに配置されたブートドライブが含まれます。

ブートドライブへのアクセスがストレージのテイクオーバーやギブバックによって中断された場合、Gridバイナリの場所またはOS全体が一時的に停止する可能性があります。ONTAPがストレージ処理を完了するのに必要な時間、およびOSがパスを変更してI/Oを再開するのに必要な時間が、 misscount しきい値。そのため、ブートLUNまたはGridバイナリへの接続がリストアされたあと、ノードはただちに削除されます。ほとんどの場合、削除とその後のリブートは実行されますが、リブートの理由を示すログメッセージは表示されません。すべての構成に影響するわけではないので、RAC環境内のSANブート、NFSブート、またはデータストアベースのホストをテストして、ブートドライブへの通信が中断してもRACが安定した状態になるようにします。

ローカルでないブートドライブまたはローカルでないファイルシステムをホストしている場合 grid バイナリ、 misscount 一致するように変更する必要があります disktimeout。このパラメータを変更した場合は、さらにテストを行い、ノードのフェイルオーバー時間など、RACの動作への影響を特定します。

ヒント
  • NetAppの推奨事項*:

  • そのままにします。 misscount 次のいずれかの条件が適用されない場合は、デフォルト値の30のパラメータを使用します。

    • grid バイナリが、ネットワークに接続されたドライブ(NFS、iSCSI、FC、データストアベースのドライブを含む)に配置されている。

    • OSがSANブートである。

  • このような場合は、ネットワークの中断がOSへのアクセスに影響するか、 GRID_HOME ファイルシステム:このような中断によって原因Oracle RACデーモンが停止し、 misscount-ベースのタイムアウトおよび削除。タイムアウトのデフォルトは27秒です。これは misscount マイナス reboottime。このような場合、 misscount 200にして一致させる disktimeout