솔루션 개요
이 문서는 ONTAP AI 및 NVIDIA DGX에 대한 대화형 AI 모델을 개략적으로 설명합니다.
NetApp ONTAP AI 및 BlueXP Copy and Sync 를 참조하십시오
NVIDIA DGX 시스템 및 NetApp 클라우드 연결형 스토리지 시스템을 기반으로 하는 NetApp ONTAP AI 아키텍처는 NetApp과 NVIDIA가 개발 및 검증했습니다. 이 참조 아키텍처는 IT 조직이 다음과 같은 이점을 얻을 수 있도록 해 줍니다.
-
설계 복잡성 제거
-
컴퓨팅과 스토리지의 독립적인 확장 지원
-
고객이 작은 규모로 시작한 후 원활하게 확장할 수 있도록 지원
-
다양한 성능 및 비용 관련 다양한 스토리지 옵션을 제공합니다.NetApp ONTAP AI는 DGX 시스템과 NetApp AFF A220 스토리지 시스템을 최첨단 네트워킹과 완벽하게 통합합니다. NetApp ONTAP AI 및 DGX 시스템은 설계 복잡성과 추측을 제거함으로써 AI 배포를 단순화합니다. 고객은 작은 규모로 시작한 후 에지에서 코어 및 클라우드까지 포괄하여 데이터를 지능적으로 관리하면서 중단 없이 시스템을 확장할 수 있습니다.
NetApp BlueXP 복사 및 동기화를 사용하면 2개의 NFS 공유, 2개의 CIFS 공유 또는 1개의 파일 공유와 Amazon S3, EFS(Amazon Elastic File System) 또는 Azure Blob 스토리지 간에 다양한 프로토콜 간에 데이터를 쉽게 이동할 수 있습니다. 액티브-액티브 작업은 소스와 타겟을 동시에 계속 사용하여 필요한 경우 데이터 변경 사항을 점진적으로 동기화할 수 있음을 의미합니다. BlueXP Copy 및 Sync는 온프레미스 또는 클라우드 기반의 모든 소스 및 타겟 시스템 간에 데이터를 이동하고 증분 동기화할 수 있게 지원하므로 데이터를 사용할 수 있는 다양한 새로운 방법을 제시합니다. 사내 시스템, 클라우드 온보딩, 클라우드 마이그레이션, 협업 및 데이터 분석 간에 데이터를 마이그레이션하는 작업을 모두 쉽게 수행할 수 있게 되었습니다. 아래 그림은 사용 가능한 소스 및 대상을 보여줍니다.
대화형 AI 시스템에서 개발자는 BlueXP Copy and Sync를 활용하여 클라우드에서 데이터 센터로 대화 기록을 아카이브함으로써 자연어 처리(NLP) 모델의 오프라인 훈련을 지원할 수 있습니다. 더 많은 연고를 인식하는 교육 모델을 통해 대화형 AI 시스템은 최종 사용자의 더 복잡한 질문을 더 효과적으로 관리할 수 있습니다.
NVIDIA Jarvis 다중 모드 프레임워크
"NVIDIA Jarvis" 대화형 AI 서비스를 구축하기 위한 엔드 투 엔드 프레임워크입니다. 다음과 같은 GPU 최적화 서비스가 포함됩니다.
-
자동 음성 인식(ASR)
-
자연어 이해(NLU)
-
도메인별 이행 서비스와 통합
-
TTS(Text-to-Speech)
-
컴퓨터 비전(CV) Jarvis 기반 서비스는 최첨단 딥 러닝 모델을 사용하여 실시간 대화 AI의 복잡하고 까다로운 작업을 해결합니다. 최종 사용자와의 자연스러운 실시간 상호 작용을 지원하기 위해 모델은 300밀리초 이내에 계산을 완료해야 합니다. 자연스러운 상호작용은 어려운 과제이며, 다중 모드 감각 통합이 필요합니다. 또한 모델 파이프라인은 복잡하며 위 서비스 간의 조정이 필요합니다.
Jarvis는 엔드 투 엔드 딥 러닝 파이프라인을 사용하는 다중 모달 대화 AI 서비스를 구축하기 위한 애플리케이션 프레임워크입니다. Jarvis 프레임워크는 음성, 비전 및 NLU 작업을 위한 사전 교육 대화 AI 모델, 도구 및 최적화된 엔드 투 엔드 서비스를 포함합니다. Jarvis를 사용하면 AI 서비스 외에도 비전, 오디오 및 기타 센서 입력을 동시에 결합하여 가상 보조자, 다중 사용자 양극화 및 콜센터 보조자와 같은 애플리케이션에서 다중 사용자, 다중 컨텍스트 대화 등의 기능을 제공할 수 있습니다.
NVIDIA 니모
"NVIDIA 니모" 사용하기 쉬운 API(애플리케이션 프로그래밍 인터페이스)를 사용하여 GPU 가속 첨단 대화 AI 모델을 구축, 교육 및 미세 조정하는 오픈 소스 Python 툴킷입니다. Nemo는 NVIDIA GPU에서 Tensor Core를 사용하여 혼합 정밀 컴퓨팅을 실행하며 여러 GPU로 손쉽게 확장하여 가능한 최고의 교육 성능을 제공할 수 있습니다. Nemo는 의료, 재무, 소매 및 통신 등 다양한 산업 분야에서 화상 통화 기록, 지능형 비디오 비서, 자동화된 콜 센터 지원 등의 실시간 ASR, NLP 및 TTS 애플리케이션을 위한 모델을 구축하는 데 사용됩니다.
Nemo를 사용하여 아카이빙된 대화 기록의 사용자 질문에서 복잡한 인텐트를 인식하는 모델을 교육했습니다. 이 교육은 소매 가상 보조자의 능력을 Jarvis가 제공하는 지원 범위를 넘어 확장합니다.
소매 사용 사례 요약
NVIDIA Jarvis를 사용하여 음성 또는 텍스트 입력을 수용하는 가상 소매 도우미를 구축하고 날씨, 관심 지점 및 재고 가격 관련 질문에 답변했습니다. 대화형 AI 시스템은 예를 들어, 사용자가 날씨 또는 관심 지점을 지정하지 않은 경우 후속 질문을 하여 대화 흐름을 기억할 수 있습니다. 또한 이 시스템은 "태국식 음식" 또는 "노트북 메모리"와 같은 복잡한 엔터티도 인식합니다. 그것은 “다음주 로스앤젤레스에서 비가 올까요?”와 같은 자연어 질문을 이해합니다. 소매 가상 비서의 데모는 에서 확인할 수 있습니다 "소매 사용 사례에 대한 상태 및 흐름을 사용자 지정합니다".