解決策テクノロジ
次の図は、提案された会話型 AI システムアーキテクチャを示しています。システムは、音声信号またはテキスト入力で操作できます。音声入力が検出された場合、 Jarvis As-as-a-Service ( AIaaS )は ASR を実行して、 Dialog Manager 用のテキストを生成します。Dialog Manager は、会話の状態を記憶し、テキストを対応するサービスにルーティングし、 Fulfillment Engine にコマンドを渡します。Jarvis NLP サービスは、テキストを受け取り、インテントとエンティティを認識し、それらのインテントとエンティティスロットをダイアログマネージャーに出力します。ダイアログマネージャーは、アクションをフルフィルメントエンジンに送信します。フルフィルメントエンジンは、回答ユーザーが照会するサードパーティ API または SQL データベースで構成されています。フルフィルメントエンジンから結果を受け取った後、 Dialog Manager はテキストを Jarvis TTS AIaaS にルーティングして、エンドユーザーの音声応答を生成します。NLP サービスがシステムとの対話をより多くのユーザが行うように改善されるように、会話履歴をアーカイブし、インテントや Nemo トレーニング用のスロットに注釈を付けることができます。
ハードウェア要件
この解決策は、 1 台の DGX ステーションと 1 台の AFF A220 ストレージシステムで検証済みです。Jarvis では、ディープニューラルネットワークの計算に T4 GPU または V100 GPU のいずれかが必要です。
次の表に、テストで解決策を実装するために必要なハードウェアコンポーネントを示します。
ハードウェア | 数量 |
---|---|
T4 または V100 GPU |
1. |
NVIDIA DGX ステーション |
1. |
ソフトウェア要件
次の表に、テストで解決策を実装するために必要なソフトウェアコンポーネントを示します。
ソフトウェア | バージョンまたはその他の情報 |
---|---|
NetApp ONTAP データ管理ソフトウェア |
9.6 |
Cisco NX-OS スイッチのファームウェア |
7.0 ( 3 ) I6 ( 1 ) |
NVIDIA DGX OS |
4.0.4 - Ubuntu 18.04 LTS |
NVIDIA Jarvis フレームワーク |
EA v0.2 の 1 つです |
NVIDIA Nemo |
nvcr.io/nvidia / Nemo : v0.10 |
Docker コンテナプラットフォーム |
18.06.1-CE [e68fc7a] |