Skip to main content
日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

GenAIインフラの導入

共同作成者

組織のFSx for ONTAPナレッジベース、コネクタ、アプリケーションを構築する前に、生成AI Infrastructure for RAGフレームワークを環境に導入する必要があります。主要なインフラコンポーネントは、Amazon Bedrockサービス、NetApp生成AIエンジンの仮想マシンインスタンス、FSx for ONTAPファイルシステムです。

展開されたインフラストラクチャは、複数のナレッジベース、チャットボット、コネクタをサポートできるため、通常はこのタスクを一度だけ実行する必要があります。

インフラの詳細

GenAI環境は、Amazon Bedrockが有効になっているAWSリージョンに配置する必要があります。 "サポートされているリージョンの一覧を表示する"

インフラストラクチャは、次のコンポーネントで構成されています。

Amazon Bedrockサービス

Amazon Bedrockは、業界をリードするAI企業の基盤モデル(FMS)を単一のAPIで使用できるフルマネージドサービスです。また、セキュアなジェネレーティブAIアプリケーションの構築に必要な機能も提供します。

Amazon Q Business

Amazon QはAmazon Bedrock上に構築されており、フルマネージドのジェネレーティブAIアシスタントを使用して、データソースからの情報に基づいて質問に答えたりコンテンツを生成したりできます。

NetApp GenAIエンジン用の仮想マシン

このプロセスでは、NetApp GenAIエンジンがデプロイされます。データソースからデータを取り込み、そのデータをベクターデータベースに書き込む処理能力を提供します。

FSx for ONTAPファイルシステム

FSx for ONTAPファイルシステムは、GenAIシステムにストレージを提供します。

データソースに基づく基本モデルによって生成されたデータを格納するベクターデータベースを含む単一のボリュームが導入されます。

ナレッジベースに統合するデータソースは、同じFSx for ONTAPファイルシステムに配置することも、別のシステムに配置することもできます。

NetApp GenAIエンジンは、これらのボリュームの両方を監視し、相互作用します。

次の図は、GenAIインフラストラクチャを示しています。この手順では、番号1、2、3のコンポーネントを展開します。展開を開始する前に、他の要素が配置されている必要があります。

生成AIインフラコンポーネントの図。

GenAIインフラの導入

AWSのクレデンシャルを入力し、FSx for ONTAPファイルシステムを選択して、Retrieval-Augmented Generation(RAG)インフラを導入する必要があります。

開始する前に

この手順を開始する前に、使用している環境がナレッジベースまたはコネクタの要件を満たしていることを確認してください。

手順
  1. いずれかを使用してワークロードファクトリにログインし"コンソールエクスペリエンス"ます。

  2. [AI Workloads]タイルで、*[Deploy & manage]*を選択します。

  3. インフラの図を確認し、* Next *を選択します。

  4. [AWS settings]セクションの項目を入力します。

    1. * AWSクレデンシャル*:AWSリソースを導入する権限を提供するAWSクレデンシャルを選択または追加します。

    2. 場所:AWSのリージョン、VPC、サブネットを選択します。

      GenAI環境は、Amazon Bedrockが有効になっているAWSリージョンに配置する必要があります。 "サポートされているリージョンの一覧を表示する"

  5. [インフラストラクチャー設定]セクションの項目を入力します。

    1. * Tags *:この導入環境に含まれるすべてのAWSリソースに適用するタグのキーと値のペアを入力します。これらのタグは、AWS管理コンソールとワークロードファクトリ内のインフラストラクチャ情報領域に表示され、ワークロードファクトリリソースを追跡するのに役立ちます。

  6. [Connectivity]*セクションに入力します。

    1. キーペア: NetApp GenAIエンジンインスタンスに安全に接続できるキーペアを選択します。

  7. 「AIエンジン*」セクションを完了します。

    1. インスタンス名:必要に応じて、*インスタンス名を定義*を選択し、AIエンジンインスタンスのカスタム名を入力します。インスタンス名はAWS Management Consoleとワークロードファクトリ内のインフラストラクチャ情報領域に表示され、ワークロードファクトリリソースを追跡するのに役立ちます。

  8. 導入*を選択して導入を開始します。

    メモ 導入がクレデンシャルエラーで失敗した場合は、エラーメッセージ内のハイパーリンクを選択すると、エラーの詳細を確認できます。見つからないかブロックされている権限のリストと、生成AIワークロードが 生成AIインフラを導入するために必要な権限のリストを確認できます。
結果

Workload Factoryはチャットボットインフラストラクチャの導入を開始します。このプロセスには最大10分かかることがあります。

導入プロセスでは、次の項目が設定されます。

  • ネットワークはプライベートエンドポイントとともにセットアップされます。

  • IAMロール、インスタンスプロファイル、およびセキュリティグループが作成されます。

  • GenAIエンジンの仮想マシンインスタンスが導入されている。

  • Amazon Bedrockは、プレフィックスを持つロググループを使用して、Amazon CloudWatch Logsにログを送信するように構成されて `/aws/bedrock/`います。

  • GenAIエンジンは、という名前のロググループを使用して、Amazon CloudWatch Logsにログを送信するように構成されてい /netapp/wlmai/<tenancyAccountId>/randomId`ます。ここで、 `<tenancyAccountID> は現在のユーザーのです "BlueXPアカウントID"