日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

GenAIインフラの導入

10/06/2025 共同作成者

組織のFSx for ONTAPナレッジベース、コネクタ、アプリケーションを構築する前に、生成AI Infrastructure for RAGフレームワークを環境に導入する必要があります。主要なインフラコンポーネントは、Amazon Bedrockサービス、NetApp生成AIエンジンの仮想マシンインスタンス、FSx for ONTAPファイルシステムです。

展開されたインフラストラクチャは、複数のナレッジベース、チャットボット、コネクタをサポートできるため、通常はこのタスクを一度だけ実行する必要があります。

インフラの詳細

GenAI環境は、Amazon Bedrockが有効になっているAWSリージョンに配置する必要があります。 "サポートされているリージョンの一覧を表示する"

インフラストラクチャは、次のコンポーネントで構成されています。

Amazon Bedrockサービス: Amazon Bedrockは、業界をリードするAI企業の基盤モデル（FMS）を単一のAPIで使用できるフルマネージドサービスです。また、セキュアなジェネレーティブAIアプリケーションの構築に必要な機能も提供します。

"Amazon Bedrockの詳細"
Amazon Q Business: Amazon QはAmazon Bedrock上に構築されており、フルマネージドのジェネレーティブAIアシスタントを使用して、データソースからの情報に基づいて質問に答えたりコンテンツを生成したりできます。

"Amazon Q Businessの詳細"
NetApp GenAIエンジン用の仮想マシン: このプロセスでは、NetApp GenAIエンジンがデプロイされます。データソースからデータを取り込み、そのデータをベクターデータベースに書き込む処理能力を提供します。
FSx for ONTAPファイルシステム: FSx for ONTAPファイルシステムは、GenAIシステムにストレージを提供します。

データソースに基づく基本モデルによって生成されたデータを格納するベクターデータベースを含む単一のボリュームが導入されます。

ナレッジベースに統合するデータソースは、同じFSx for ONTAPファイルシステムに配置することも、別のシステムに配置することもできます。

NetApp GenAIエンジンは、これらのボリュームの両方を監視し、相互作用します。

次の図は、GenAIインフラストラクチャを示しています。この手順では、番号1、2、3のコンポーネントを展開します。展開を開始する前に、他の要素が配置されている必要があります。

生成AIインフラコンポーネントの図。

GenAIインフラの導入

AWSのクレデンシャルを入力し、FSx for ONTAPファイルシステムを選択して、Retrieval-Augmented Generation（RAG）インフラを導入する必要があります。

開始する前に

この手順を開始する前に、使用している環境がナレッジベースまたはコネクタの要件を満たしていることを確認してください。

手順

次のいずれかを使用してWorkload Factoryにログインします。"コンソールエクスペリエンス" 。
[AI Workloads]タイルで、*[Deploy & manage]*を選択します。
インフラの図を確認し、* Next *を選択します。
[AWS settings]セクションの項目を入力します。
1. * AWSクレデンシャル*：AWSリソースを導入する権限を提供するAWSクレデンシャルを選択または追加します。
2. 場所：AWSのリージョン、VPC、サブネットを選択します。
  
  GenAI環境は、Amazon Bedrockが有効になっているAWSリージョンに配置する必要があります。 "サポートされているリージョンの一覧を表示する"
[インフラストラクチャー設定]セクションの項目を入力します。
1. タグ: このデプロイメントの一部であるすべての AWS リソースに適用するタグのキーと値のペアを入力します。これらのタグは、AWS マネジメントコンソールと Workload Factory 内のインフラストラクチャ情報領域に表示され、Workload Factory リソースを追跡するのに役立ちます。
[Connectivity]*セクションに入力します。
1. キーペア: NetApp GenAIエンジンインスタンスに安全に接続できるキーペアを選択します。
「AIエンジン*」セクションを完了します。
1. インスタンス名: オプションで、*インスタンス名の定義*を選択し、AI エンジンインスタンスのカスタム名を入力します。インスタンス名は AWS マネジメントコンソールと Workload Factory 内のインフラストラクチャ情報領域に表示され、Workload Factory リソースを追跡するのに役立ちます。

導入*を選択して導入を開始します。

導入がクレデンシャルエラーで失敗した場合は、エラーメッセージ内のハイパーリンクを選択すると、エラーの詳細を確認できます。見つからないかブロックされている権限のリストと、生成AIワークロードが生成AIインフラを導入するために必要な権限のリストを確認できます。

結果

Workload Factory がチャットボットインフラストラクチャの展開を開始します。このプロセスには最大 10 分かかる場合があります。

導入プロセスでは、次の項目が設定されます。

ネットワークはプライベートエンドポイントとともにセットアップされます。
IAMロール、インスタンスプロファイル、およびセキュリティグループが作成されます。
GenAIエンジンの仮想マシンインスタンスが導入されている。
Amazon Bedrockは、プレフィックスを持つロググループを使用して、Amazon CloudWatch Logsにログを送信するように構成されて `/aws/bedrock/`います。
GenAIエンジンは、次の名前のロググループを使用してAmazon CloudWatch Logsにログを送信するように設定されています。 /netapp/wlmai/<tenancyAccountId>/randomId 、どこ `<tenancyAccountID>`は "NetAppコンソールアカウントID"現在のユーザーに対して。

GenAIインフラの導入

Creating your file...

インフラの詳細

GenAIインフラの導入