適切に設計されたワークロードを構築および運用する
Amazon FSx for NetApp ONTAP用のNetApp管理スイートである Workload Factory は、AWS Well-Architected フレームワークに準拠した、信頼性が高く、安全で、効率的で、対費用効果の高いストレージとデータベース構成の維持と運用に役立ちます。Workload Factory は、ストレージとデータベースのワークロードの毎日の分析、推奨事項、自動修正を提供し、健全なワークロード操作を促進します。このプロセスを自動化することで、Workload Factory は人的エラーを最小限に抑え、ワークロード管理の一貫性を確保します。
仕組み
Workload Factory は、Amazon FSx for NetApp ONTAPファイルシステム、 Microsoft SQL Server、および Oracle データベースのデプロイメントを毎日分析します。毎日の分析では、適切に設計されたステータス、洞察、および構成の問題を自動的に修正するオプションを含む推奨事項が提供され、デプロイメントがベスト プラクティスを満たし、効率的に動作するようにすることができます。
毎日の分析が完了すると、デプロイメントの Well-architected ダッシュボードに構成が「最適化済み」または「最適化されていない」として表示されます。全体的な最適化スコア、カテゴリ別の構成の問題、構成の問題と推奨事項のリストが表示されます。構成の問題に関する推奨事項を確認できます。一部の問題は Workload Factory によって自動的に修正できますが、その他の問題は手動での介入が必要です。この場合、Workload Factory は、推奨される変更を実装するのに役立つ詳細な手順を提供します。
ストレージとデータベースのワークロードの要件は異なるため、環境に適用されない特定の構成の分析を無視できます。これにより、不要なアラートや不正確な最適化結果を回避できます。特定の構成分析を無視すると、その構成は全体の最適化スコアに含まれなくなります。
なぜそれが重要なのか
Workload Factory は、大規模なストレージまたはデータベース環境にベスト プラクティスを手動で適用するという困難な作業を簡素化します。Workload Factory コンソールからの最適ではない構成の分析と修復を組み合わせることで、このプロセスを合理化します。Workload Factory コンソール内で適用された修正により、人為的エラーのリスクが排除され、ストレージとデータベース管理の統一性が確保されます。自動化を活用することで、構成が毎回正しく適用され、長期間にわたって維持されることを保証できるため、ストレージ インフラストラクチャ全体で高いパフォーマンスと信頼性の基準を維持できます。
Workload Factory を使って誤った構成を検出し修正しましょう
Workload Factory の使用を開始するには、サインアップしてアカウントを作成し、認証情報を追加して接続を確立し、Workload Factory が AWS リソースを直接管理できるようにしてから、 Amazon FSx for NetApp ONTAPを使用してワークロードを最適化します。
ストレージワークロードのベストプラクティスと推奨事項
Workload Factory は、ストレージ管理に関するONTAP構成のベスト プラクティスを詳細に説明します。具体的には、Workload Factory 内のストレージワークロードは、AWS Well-Architected フレームワークの柱に準拠しているかどうかについてストレージ構成を分析し、最適ではない構成に対して推奨事項と修復を提供します。ストレージの Well-Architected ステータス ダッシュボードから、Well-Architected のベスト プラクティスを実装して FSx for ONTAPファイル システムの最適なパフォーマンスと信頼性を実現するのに役立つ分析情報が得られます。
Well-Architected 分析では、フレームワークの次の柱に従って構成を分類します: 信頼性、セキュリティ、運用上の卓越性、コスト最適化、および パフォーマンス効率。
信頼性
信頼性により、中断が発生した場合でも、ワークロードが意図した機能を正しく一貫して実行することが保証されます。
-
* ONTAPバックアップ用に FSx をスケジュールする*
FSx for ONTAP: ボリュームをバックアップすると、データ保持とコンプライアンスのニーズをサポートできます。FSx for ONTAPバックアップを使用して、データの集中管理された自動バックアップおよび保持戦略を実装します。
-
ローカルスナップショットをスケジュールする
効率的なバックアップと迅速な復元のためにローカル スナップショットをスケジュールします。スナップショットは、ボリュームの即時のポイントインタイムのイメージです。
-
クロスリージョンレプリケーション
クロスリージョンレプリケーションにより、データが別の AWS リージョンにレプリケートされ、データの耐久性と可用性が向上します。Workload Factory では、災害復旧とコンプライアンス要件のためにリージョン間レプリケーションを構成することを推奨しています。
-
データ複製を設定する
データの信頼性を高めるために、データを同じリージョンまたは別のリージョンの FSx for ONTAPファイルシステムに複製できます。ファイル システム間での移行、災害復旧、長期保存をサポートするために、データ レプリケーションを設定します。
-
SSD容量のしきい値を増やす
SSD ストレージ層の容量は、継続的に 80% の使用率を超えてはなりません。これにより、容量プールのストレージ層へのデータの読み取りと書き込みに影響が及ぶ可能性があり、ファイル システムのスループット容量にも影響が及ぶ可能性があります。容量が不足すると、データ ボリュームが読み取り専用になり、新しいデータを書き込もうとするサービスが失敗する可能性があります。
-
データの信頼性を確保するためにラベルを一致させる
データの信頼性を確保するには、ソース ボリュームのスナップショット ポリシー ラベルとレプリケーション ポリシー ラベルが一致している必要があります。
-
ファイル容量のしきい値を増やす
ボリューム容量の制限に達しないように、ファイル容量のしきい値を上げる必要があります。ファイル容量 (i ノード) が少ないと、ボリュームに追加データを書き込むことができなくなります。Workload Factory では、利用可能なファイル容量の使用率を継続的に 80% 未満に抑えることを推奨しています。ボリューム内に新しいファイルを作成するには、使用可能なファイル容量が必要です。
セキュリティ
セキュリティでは、リスク評価と軽減戦略を通じてデータ、システム、資産を保護することに重点が置かれます。
-
ARP/AIを有効にする
NetApp Autonomous Ransomware Protection with AI (ARP/AI) は、サイバーレジリエンスを強化し、進化するランサムウェアの脅威からボリュームをアクティブに保護します。Workload Factory では、すべてのボリュームに対して ARP/AI を有効にすることをお勧めします。
-
ボリュームへの不正アクセス
iSCSI を使用してアプリケーション データを提供するボリュームでは、NAS アクセスを並行して許可しないでください。Workload Factory では、iSCSI プロトコル経由でアクセスされるボリュームを、追加のプロトコルに制限することを推奨しています。
オペレーションの卓越性
運用の卓越性は、最適なアーキテクチャとビジネス価値の提供に重点を置いています。
-
自動容量管理を有効にする
SSD 層がしきい値を超えないように定期的に確認するには、自動容量管理を有効にする必要があります。
-
ボリューム容量使用率しきい値
Workload Factory では、ボリューム容量の使用率が継続的に 80% を超えないようにすることを推奨しています。これにより、アプリケーションへのデータの読み取りと書き込みに影響する可能性があります。ボリューム容量の増加は、ボリュームの自動拡張機能を使用して手動で行うことも、自動で行うこともできます。
-
ボリューム使用率がほぼ満杯に近づいています
ボリュームの容量がいっぱいに近づいた場合、Workload Factory は、潜在的なアプリケーションの中断を回避するためにボリューム容量を増やすアクションを実行することを推奨します。
-
キャッシュ関係書き込みモード
最適なパフォーマンスを得るために、Workload Factory はワークロードに最適なキャッシュ リレーションシップ書き込みモードを推奨します。ライトアラウンド モードでは、小さなファイルで読み取りが多いワークロードのパフォーマンスが向上しますが、ライトバック モードでは、大きなファイルで書き込みが多いワークロードのパフォーマンスが向上します。
コスト最適化
コスト最適化は、コストを最小限に抑えながらビジネス価値を提供することを目的としています。
-
コールドデータを階層化してTCOを最適化
SSD ストレージ層の使用率を削減するには、コールド データ階層化を有効にする必要があります。すべてのボリュームに階層化ポリシーを適用することをお勧めします。FSx for ONTAP はデータを継続的にスキャンしてコールドデータを検出し、中断することなく容量ストレージプール層に移動します。
-
ストレージ効率を向上
ストレージ使用率を最適化し、SSD 層のコストを削減するには、ストレージ効率 (圧縮、圧縮、重複排除) を有効にする必要があります。
-
不要なスナップショットとバックアップの削除
不要になったスナップショットとバックアップは、コストを削減するために削除する必要があります。
データベースワークロードのベストプラクティスと推奨事項
Workload Factory は、適切に設計されたデータベース ワークロードを運用するためのベスト プラクティスと推奨事項のセットを提供します。Well-Architected 分析では、ストレージのサイズ設定、ストレージ レイアウト、ストレージ構成、コンピューティング、アプリケーション (SQL Server)、および回復力に関連するMicrosoft SQL Serverおよび Oracle データベースの構成と設定を評価します。
ストレージのサイズ
-
ストレージ層
最適なストレージ パフォーマンスを得るには、プライマリ SSD 層に FSx for ONTAPボリュームをプロビジョニングします。容量プール層を使用すると、パフォーマンスが低下し、待機時間が長くなる可能性があります。
-
ファイルシステムのヘッドルーム
ストレージ パフォーマンスを最適化するには、プロビジョニングされたボリュームの合計サイズの 1.35 倍のファイル システム容量をプロビジョニングします。
ファイル システムのヘッドルーム パーセンテージは次のとおりです。
-
不足: < 35%
-
最適化: 35~100%
-
過剰プロビジョニング: > 100%
-
-
ログドライブのサイズ
ログ ドライブがいっぱいになることで発生するトランザクションのロールバック、データベースの使用不可、データ破損、パフォーマンスの低下などの問題を防ぐために、SQL Server ログ ドライブの正確なサイズ設定と定期的な監視を確実に実行します。
ログ ドライブのサイズの割合は次のとおりです。
-
不足: < 20%
-
最適化: 20~30%
-
過剰プロビジョニング: > 30%
-
-
TempDB ドライブのサイズ
パフォーマンスを最適化し、全体的な安定性を維持するために、SQL Server TempDB の正確なサイズ設定と定期的な監視を確実に実行します。適切に構成された TempDB は、パフォーマンスの問題や不安定さを防ぎます。スペースが不足したり競合が多発したりすると、クエリの速度低下、アプリケーションのタイムアウト、システムクラッシュが発生する可能性があります。
TempDB ドライブ サイズの割合は次のとおりです。
-
不足: < 10%
-
最適化: 10~20%
-
過剰プロビジョニング: > 20%
-
ストレージレイアウト
-
データファイル(.mdf)の配置
データ ファイルとログ ファイルを異なるドライブに分離すると、同時 I/O アクティビティ、独立したバックアップ スケジュール、および復元機能の向上が可能になり、パフォーマンスが向上します。小規模なデータベースの場合は、データとログの LUN パスを異なるボリュームに分離することをお勧めします。大規模なデータベース (> 500 GiB) が複数ある場合は、この分離が必要です。
-
ログファイル(.ldf)の配置
データ ファイルとログ ファイルを異なるドライブに分離すると、同時 I/O アクティビティ、独立したバックアップ スケジュール、および復元機能の向上が可能になり、パフォーマンスが向上します。小規模なデータベースの場合は、データとログの LUN パスを異なるボリュームに分離することをお勧めします。大規模なデータベース (> 500 GiB) が複数ある場合は、この分離が必要です。
-
TempDB の配置
TempDB を専用のドライブに配置することで、TempDB I/O を分離し、他のデータベースからの I/O 競合を回避します。この最適化により、SQL Server の全体的なパフォーマンスと安定性が向上します。これを怠ると、重大な I/O ボトルネック、クエリ パフォーマンスの低下、システムの不安定化が発生する可能性があります。
ストレージ構成
-
* ONTAP構成*
エンティティ 設定 推奨事項 Volume
-
シンプロビジョニング (-space-guarantee = none)
-
自動サイズ設定オン
-
自動サイズモード = 拡大
-
部分準備金 = 0%
-
スナップショットコピーリザーブ = 0%
-
スナップショットの自動削除(ボリューム/古いものから)
-
スペース管理の試行を最初に実行 = volume_grow
ストレージ効率とコスト効率を最適化するには、FSx for ONTAPボリュームのシンプロビジョニング、自動サイズ設定、およびスペース管理オプションを設定します。シン プロビジョニングを行わないと、ストレージは事前に割り当てられるため、非効率的な使用と過剰プロビジョニングによるコストの増加につながります。静的割り当てでは未使用の容量に対して料金が発生し、経費が増加します。動的割り当てが行われないため、スケーラビリティと柔軟性が低下し、パフォーマンスに影響を及ぼします。また、スペースの再利用を行わないと、削除されたデータがスペースを占有し、効率が低下します。
Volume
-
階層化ポリシー = スナップショットのみ
-
階層化最小冷却日数 = 7
最適なデータベース パフォーマンスとコスト効率を実現するために、Workload Factory ではスナップショットのみを容量層に移動することを推奨しています。この戦略により、コストを削減しながら高いパフォーマンスが保証されます。特に、7 日以上経過したスナップショットを階層化することをお勧めします。
LUN
OSの種類 = windows_2008
I/O アライメントを実現するには、 ONTAP LUN OS タイプ値がオペレーティング システムのパーティション スキームと一致する必要があります。構成が正しくない場合、パフォーマンスが最適にならない可能性があります。
LUN
スペース予約が有効
スペース リザベーションを有効にすると、 ONTAP はボリューム内に十分なスペースを予約し、ディスク スペース不足のために LUN への書き込みが失敗しないようにします。
LUN
スペース割り当てが有効
このオプションにより、ボリュームがいっぱいになって書き込みを受け付けなくなったときに、FSx for ONTAPが EC2 ホストに通知するようになります。この設定により、EC2 ホスト上の SQL Server がデータを削除したときに、FSx for ONTAPが自動的にスペースを再利用することも可能になります。無効にすると、書き込みが失敗する可能性があり、スペースが効率的に利用されない可能性があります。
-
-
Windows ストレージ構成
エンティティ 設定 推奨事項 Microsoft マルチパス I/O (MPIO)
-
ステータス = 有効
-
ポリシー = ラウンドロビン
-
セッション数 = 5
FSx for ONTAPでプロビジョニングされた基盤となる LUN を持つ EC2 上のMicrosoft SQL Serverデータベースの最適な稼働時間とデータアクセスの一貫性を確保するために、Workload Factory では、マルチパス I/O (MPIO) を有効にして設定することを推奨しています。MPIO は FSx for ONTAPへの複数のパスを提供し、回復力とパフォーマンスの両方を強化します。このベスト プラクティスは、コンポーネントに障害が発生した場合でもデータ アクセスを維持することで、潜在的なデータ損失やダウンタイムを防ぎます。
アロケーションユニットサイズ
NTFSアロケーションユニットサイズ = 64K
NTFS 割り当て単位サイズを 64K に設定すると、ディスク領域をより有効に活用し、断片化を減らし、ファイルの読み取り / 書き込みパフォーマンスが向上します。これを適切に構成しないと、ディスクの使用効率が低下し、パフォーマンスが低下する可能性があります。
-
コンピューティング
-
コンピューティングの適正化
SQL Server EC2 インスタンスの最適なパフォーマンスとコスト効率を確保するには、ワークロードの需要に基づいて適切なサイズを設定することをお勧めします。現在のインスタンスが不足している場合は、アップグレードすると CPU、メモリ、I/O 容量が強化されます。過剰にプロビジョニングされている場合は、ダウングレードすることでパフォーマンスを維持しながらコストを削減できます。
-
オペレーティング システム パッチ
セキュリティと安定性を確保するために、可能な限り最新のパッチを適用してください。最新のパッチを適用すると、SQL Server データベースを脆弱性から保護し、システム全体の信頼性を大幅に向上させることができます。
-
ネットワークアダプタの設定
Microsoft SQL Serverインスタンスで最適なネットワーク パフォーマンスを得るには、受信側スケーリング (RSS) を正確に構成することが不可欠です。RSS はネットワーク処理を複数のプロセッサに分散し、ボトルネックを防止してシステム パフォーマンスを向上させます。Workload Factory では、次の RSS 設定を推奨しています。
-
TCP オフロード機能を無効にする: すべての TCP オフロード機能が無効になっていることを確認します。
-
受信キューの数: vCPU が 8 を超える場合は 8 に設定します。vCPU が 8 以下の場合は、vCPU の数に設定します。
-
RSS プロファイル: NUMAStatic に設定します。
-
ベースプロセッサ番号: 2 に設定します。
これらの設定に従うと、Microsoft SQL Serverインスタンスのパフォーマンスと信頼性が向上します。本番環境に変更を加える前に、推奨設定をテストしてパフォーマンスの向上を確認することをお勧めします。
-
アプリケーション (SQL Server)
-
ライセンス
SQL Server ライセンスの評価と推奨は、ホスト レベルで提供されます。
最適化されていません: データベース インフラストラクチャが、支払っている商用ソフトウェア ライセンスの機能をまったく使用していないことを Workload Factory が検出した場合、ライセンスは「最適化されていない」とみなされます。最適化されていないライセンスでは、不必要なコストが発生する可能性があります。
最適化: データベースの商用ソフトウェア ライセンスがパフォーマンス要件を満たしている場合、ライセンスは「最適化」されているとみなされます。
-
* Microsoft SQL Serverパッチ*
セキュリティと安定性を確保するために、可能な限り最新のパッチを適用してください。最新のパッチを適用すると、SQL Server データベースを脆弱性から保護し、システム全体の信頼性を大幅に向上させることができます。
-
マックスドップ
並行処理のバランスをとることでクエリのパフォーマンスを最適化するには、最大並列度 (MAXDOP) を設定します。正確な MAXDOP 構成により、パフォーマンスと効率が向上します。通常、MAXDOP を 4、8、または 16 に設定すると、ほとんどのユース ケースで最適な結果が得られます。ワークロードをテストし、CXPACKET などの並列処理関連の待機タイプを監視することをお勧めします。
信頼性
-
* ONTAPバックアップ用に FSx をスケジュールする*
Microsoft SQL Serverボリュームのバックアップは、データ保持とコンプライアンスの要件をサポートするために不可欠です。FSx for ONTAPバックアップを使用して、SQL Server データの集中管理された自動バックアップおよび保持戦略を実装します。
-
ローカルスナップショットをスケジュールする
効率的なバックアップと迅速な復元のためにローカル スナップショットをスケジュールします。スナップショットは、ボリュームの即時のポイントインタイムのイメージです。
-
クロスリージョンレプリケーション
クロスリージョンレプリケーションにより、データが別の AWS リージョンにレプリケートされ、データの耐久性と可用性が向上します。Workload Factory では、災害復旧とコンプライアンス要件のためにリージョン間レプリケーションを構成することを推奨しています。