ネットアップのデータファブリックを基盤としたビッグデータアーキテクチャ
ネットアップのデータファブリックは、クラウド環境とオンプレミス環境全体でデータ管理を簡易化、統合することで、デジタル変革を加速します。
ネットアップのデータファブリックは、一貫した統合的データ管理サービスとアプリケーション(ビルディングブロック)を提供し、データの可視性と分析、データのアクセスと制御、データの保護とセキュリティを実現します。以下の図を参照してください。
実績のあるデータファブリックのユースケース
ネットアップのデータファブリックは、以下の 9 つのユースケースをお客様に提供します。
-
分析ワークロードを高速化
-
DevOps 変革を加速
-
クラウドとホスティングのインフラ構築
-
クラウドデータサービスを統合
-
データの保護とセキュリティ
-
非構造化データを最適化
-
データセンターの効率化
-
データの分析と管理を実現
-
簡易化と自動化
このドキュメントでは、 9 つのユースケースのうち 2 つを取り上げ、それぞれのソリューションを紹介します。
-
分析ワークロードを高速化
-
データの保護とセキュリティ
NetApp NFS への直接アクセス
NetApp NFSを使用すると、既存または新規のNFSv3 / NFSv4データに対して、データを移動またはコピーすることなくビッグデータ分析ジョブを実行できます。データの複数のコピーが作成されるため、ソースとデータを同期する必要がありません。たとえば、金融機関では、ある場所から別の場所へデータを移動する際に法的義務を果たす必要がありますが、これは容易な作業ではありません。このシナリオでは、 NetApp NFS の直接アクセスによって、元の場所から財務データが分析されます。もう 1 つの主な利点は、 NetApp NFS 直接アクセスを使用すると、ネイティブの Hadoop コマンドを使用して Hadoop データを保護しやすくなることと、ネットアップの充実したデータ管理ポートフォリオを活用してデータ保護ワークフローを実現できることです。
NetApp NFS 直接アクセスでは、 Hadoop クラスタと Spark クラスタに対して次の 2 種類の導入オプションを提供しています。
-
デフォルトでは、 Hadoop / Spark クラスタは、データストレージとデフォルトのファイルシステムに Hadoop Distributed File System ( HDFS ; Hadoop 分散ファイルシステム)を使用しています。NetApp NFS の直接アクセスを使用すると、デフォルトの HDFS をデフォルトのファイルシステムとして NFS ストレージに置き換えることができるため、 NFS データに対する直接分析処理が可能になります。
-
もう 1 つの導入オプションでは、 NetApp NFS 直接アクセスを使用して、 1 つの Hadoop / Spark クラスタ内に HDFS を追加のストレージとして構成することもできます。この場合、 NFS エクスポートを介してデータを共有し、 HDFS データと同じクラスタからデータにアクセスできます。
NetApp NFS 直接アクセスを使用する主な利点は次のとおりです。
-
現在の場所からデータを分析するため、分析データを HDFS などの Hadoop インフラに移動する時間とパフォーマンスのかかるタスクは発生しません。
-
レプリカの数を 3 つから 1 つに減らします。
-
ユーザはコンピューティングとストレージを切り離して個別に拡張できます。
-
ONTAP の豊富なデータ管理機能を活用して、エンタープライズデータを保護します。
-
Hortonworks データプラットフォームで認定されています。
-
ハイブリッドデータ分析環境を実現
-
動的なマルチスレッド機能を活用して、バックアップ時間を短縮します。
ビッグデータ向けのビルディングブロック
ネットアップのデータファブリックは、以下の図に示すように、データアクセス、制御、保護、セキュリティのためのデータ管理サービスとアプリケーション(ビルディングブロック)を統合しています。
上の図の構成要素は次のとおりです。
-
* NetApp NFS 直接アクセス。 * 最新の Hadoop クラスタと Spark クラスタを、ソフトウェアやドライバの追加の必要なしに NetApp NFS ボリュームに直接アクセスできます。
-
* NetApp Cloud Volumes ONTAPとGoogle Cloud NetApp Volumes *Amazon Web Services(AWS)またはMicrosoft AzureクラウドサービスのAzure NetApp Files(ANF)で実行されるONTAPベースのSoftware-Defined接続ストレージ。
-
* NetApp SnapMirror テクノロジ * 。オンプレミスと ONTAP クラウドインスタンスまたは NPS インスタンス間でデータ保護機能を提供します。
-
* クラウド・サービス・プロバイダー。 * これらのプロバイダーには、 AWS 、 Microsoft Azure 、 Google Cloud 、 IBM Cloud が含まれます。
-
* PaaS * AWS の Amazon Elastic MapReduce ( EMR )や Databricks 、 Microsoft Azure HDInsight 、 Azure Databricks などのクラウドベースの分析サービスを利用できます。