Skip to main content
NetApp artificial intelligence solutions
본 한국어 번역은 사용자 편의를 위해 제공되는 기계 번역입니다. 영어 버전과 한국어 버전이 서로 어긋나는 경우에는 언제나 영어 버전이 우선합니다.

TR-4928: 책임 있는 AI 및 기밀 추론 - Protopia 이미지 및 데이터 변환을 갖춘 NetApp AI

Sathish Thyagarajan, Michael Oglesby, NetApp 안병훈, Jennifer Cwagenberg, Protopia

이미지 캡처와 이미지 처리의 등장으로 시각적 해석은 의사소통의 필수적인 부분이 되었습니다. 디지털 영상 처리 분야의 인공지능(AI)은 암 및 기타 질병 식별을 위한 의료 분야, 환경적 위험 연구를 위한 지리공간적 시각 분석, 패턴 인식, 범죄와 싸우기 위한 비디오 처리 등 새로운 사업 기회를 가져다줍니다. 하지만 이러한 기회에는 엄청난 책임도 따릅니다.

조직이 AI에게 더 많은 결정을 맡길수록 데이터 개인정보 보호 및 보안, 법적, 윤리적, 규제적 문제와 관련된 위험을 감수하게 됩니다. 책임 있는 AI는 기업과 정부 기관이 대규모 기업에서 AI를 대규모로 사용하는 데 중요한 신뢰와 거버넌스를 구축할 수 있는 관행을 가능하게 합니다. 이 문서에서는 NetApp 데이터 관리 기술과 Protopia 데이터 난독화 소프트웨어를 사용하여 민감한 데이터를 비공개로 처리하고 위험과 윤리적 문제를 줄이는 세 가지 시나리오에서 NetApp 이 검증한 AI 추론 솔루션을 설명합니다.

소비자와 기업 모두 다양한 디지털 기기를 통해 매일 수백만 개의 이미지를 생성합니다. 이로 인해 데이터와 컴퓨팅 작업 부하가 엄청나게 늘어나면서 기업은 규모와 효율성을 위해 클라우드 컴퓨팅 플랫폼으로 전환하게 되었습니다. 한편, 이미지 데이터에 포함된 민감한 정보에 대한 개인정보 보호 우려가 퍼블릭 클라우드로 전송되면서 발생합니다. 보안 및 개인정보 보호 보장의 부족은 이미지 처리 AI 시스템 구축의 주요 장애물이 됩니다.

또한, "삭제 권리" GDPR에 따르면 개인은 조직에 자신의 모든 개인 데이터를 삭제하도록 요청할 권리가 있습니다. 또한 있습니다 "개인정보보호법" 공정한 정보 관행에 대한 규정을 제정한 법률입니다. 사진과 같은 디지털 이미지는 GDPR에 따라 개인 데이터로 간주될 수 있습니다. GDPR은 데이터를 수집, 처리, 삭제하는 방법을 규정합니다. 이를 이행하지 않을 경우 GDPR을 준수하지 않는 것으로 간주되어, 규정 위반에 대한 엄청난 벌금이 부과될 수 있으며, 이는 조직에 심각한 피해를 줄 수 있습니다. 개인정보 보호 원칙은 머신 러닝(ML) 및 딥 러닝(DL) 모델 예측의 공정성을 보장하고 개인정보 보호 또는 규정 준수 위반과 관련된 위험을 낮추는 책임 있는 AI 구현의 핵심입니다.

이 문서에서는 개인 정보 보호 및 책임 있는 AI 솔루션 배포와 관련된 이미지 난독화가 있는 세 가지 시나리오에서 검증된 설계 솔루션을 설명합니다.

  • 시나리오 1. Jupyter Notebook에서 주문형 추론이 가능합니다.

  • 시나리오 2. Kubernetes에서의 일괄 추론.

  • 시나리오 3. NVIDIA Triton 추론 서버.

이 솔루션을 위해, 우리는 제약 없는 얼굴 감지 문제를 연구하기 위해 설계된 얼굴 영역의 데이터 세트인 FDDB(Face Detection Data Set and Benchmark)를 사용하는데, 이는 FaceBox 구현을 위한 PyTorch 머신 러닝 프레임워크와 결합되었습니다. 이 데이터 세트에는 다양한 해상도의 2845개 이미지 세트에 있는 5171개 얼굴에 대한 주석이 포함되어 있습니다. 또한 이 기술 보고서는 NetApp 고객과 현장 엔지니어로부터 이 솔루션을 적용할 수 있는 상황에서 수집한 일부 솔루션 영역과 관련 사용 사례를 제시합니다.

타겟 고객층

이 기술 보고서는 다음 독자를 대상으로 합니다.

  • 공공 장소에서 얼굴 이미지 처리와 관련된 데이터 보호 및 개인 정보 보호 문제를 해결하고 책임감 있는 AI를 설계하고 배포하고자 하는 기업 리더와 엔터프라이즈 설계자.

  • 개인정보를 보호하고 보존하는 것을 목표로 하는 데이터 과학자, 데이터 엔지니어, AI/머신러닝(ML) 연구자, AI/ML 시스템 개발자.

  • GDPR, CCPA, 국방부(DoD) 및 정부 기관의 개인정보 보호법 등의 규제 표준을 준수하는 AI/ML 모델 및 애플리케이션을 위한 데이터 난독화 솔루션을 설계하는 엔터프라이즈 아키텍트입니다.

  • 민감한 정보를 보호하는 딥 러닝(DL) 및 AI/ML/DL 추론 모델을 배포하는 효율적인 방법을 찾고 있는 데이터 과학자와 AI 엔지니어.

  • 에지 추론 모델의 배포와 관리를 담당하는 에지 장치 관리자와 에지 서버 관리자입니다.

솔루션 아키텍처

이 솔루션은 기존 CPU와 함께 GPU의 처리 능력을 활용하여 대규모 데이터 세트에 대한 실시간 및 일괄 추론 AI 워크로드를 처리하도록 설계되었습니다. 이 검증은 책임 있는 AI 배포를 추구하는 조직에 필요한 ML의 개인 정보 보호 추론과 최적의 데이터 관리를 보여줍니다. 이 솔루션은 Jupyter Lab 및 CLI 인터페이스를 사용하여 NetApp ONTAP AI(온프레미스 핵심), NetApp DataOps Toolkit, Protopia 난독화 소프트웨어와 상호 연결된 엣지 및 클라우드 컴퓨팅을 위한 단일 또는 다중 노드 Kubernetes 플랫폼에 적합한 아키텍처를 제공합니다. 다음 그림은 NetApp 과 DataOps Toolkit 및 Protopia가 지원하는 데이터 패브릭의 논리적 아키텍처 개요를 보여줍니다.

입력/출력 대화 상자 또는 서면 내용을 나타내는 그림

Protopia 난독화 소프트웨어는 NetApp DataOps Toolkit 상에서 원활하게 실행되며 스토리지 서버를 떠나기 전에 데이터를 변환합니다.