TR-4928:『Responsible AI and Confidential Inferencing - NetApp AI with Protopia Image and Data Transformation』
Sathish Thyagarajan氏、Michael Oglesby氏、NetApp Byung Hoon Ahn氏、Jennifer Cwagenberg氏、Protopia氏
画像の撮影や画像処理の出現とのコミュニケーションには、視覚的な解釈が不可欠です。デジタル画像処理における人工知能(AI)は、がんやその他の疾患識別のための医療分野などの新たなビジネスチャンスをもたらします。また、地球空間での視覚分析による環境ハザード調査、パターン認識、犯罪と闘うためのビデオ処理などにも活用できます。しかし、この機会には特別な責任も伴います。
AIを導入する意思決定が増えるほど、データのプライバシー、セキュリティ、法律、倫理、規制に関する問題に関連するリスクを受け入れることができます。責任あるAIは、大企業のAIに欠かせない信頼とガバナンスを企業や政府機関が構築できるようにするための実践を可能にします。本ドキュメントでは、ネットアップが3つの異なるシナリオで検証したAI推論解決策 について説明します。この検証では、Protopiaデータ難読化ソフトウェアとネットアップのデータ管理テクノロジを併用して、機密データをプライベート化し、リスクと倫理的な懸念を軽減します。
毎日何百万もの画像が生成され、消費者とビジネスエンティティの両方がさまざまなデジタルデバイスを使用します。その結果、データとコンピューティングのワークロードが急増し、企業はクラウドコンピューティングプラットフォームを利用して、拡張性と効率性を高めることになります。一方、画像データに含まれる機密情報に関するプライバシーの懸念は、パブリッククラウドへの転送によって生じます。画像処理AIシステムの導入における主な障壁は、セキュリティとプライバシーの欠如です。
また、もあります "イレイジャーコーディングの権利" GDPRでは、組織がすべての個人データを消去するように要求する権利が個人に与えられます。また、もあります "プライバシー法"は、公正な情報慣行のコードを確立します。写真などのデジタル画像は、GDPRに基づく個人データを構成し、データの収集、処理、消去の方法を規定します。これを怠るとGDPRに準拠できず、組織に深刻な損害を与える可能性があるコンプライアンス違反に対する多額の罰金が科せられる可能性があります。プライバシーに関する原則は、機械学習(ML)モデルとディープラーニング(DL)モデルの予測において公平性を確保し、プライバシーや規制へのコンプライアンス違反に伴うリスクを軽減する、責任あるAIを実装するためのバックボーンとなっています。
このドキュメントでは、プライバシーの保護と責任あるAI解決策 の導入に関連する画像難読化機能を使用した、または使用しない、3つの異なるシナリオにおける検証済み設計解決策 について説明します。
-
シナリオ1. Jupyterノートブック内でのオンデマンド推論。
-
シナリオ2. Kubernetesでのバッチ推論。
-
シナリオ3. NVIDIA * Triton推論サーバ。
この解決策 では、フェース検出データセットとベンチマーク(FDDB)を使用します。これは、フェース検出の問題を調査するために設計されたフェース領域のデータセットで、PyTorch機械学習フレームと組み合わせて、フェースボックスを実装するためのフレームワークです。このデータセットには、さまざまな解像度の2845枚の画像セットに5171個の面の注釈が含まれています。さらに、このテクニカルレポートでは、この解決策 を適用できる状況において、ネットアップのお客様やフィールドエンジニアから収集した解決策 の領域と関連するユースケースを紹介します。
対象読者
このテクニカルレポートは、次のような方を対象としています。
-
公共スペースでの顔画像処理に関するデータ保護やプライバシーの問題に対処するために、責任あるAIの設計と導入を希望するビジネスリーダーおよびエンタープライズアーキテクト。
-
データサイエンティスト、データエンジニア、AI /機械学習(ML)研究者、AI / MLシステム開発者は、プライバシーの保護と維持を目指します。
-
GDPR、CCPA、国防総省(DoD)や政府機関のプライバシー法などの規制基準に準拠するAI / MLモデルおよびアプリケーション向けのデータ難読化ソリューションを設計するエンタープライズアーキテクト。
-
データサイエンティストとAIエンジニアは、機密情報を保護するディープラーニング(DL)モデルとAI / ML / DL推論モデルを効率的に導入する方法を探しています。
-
エッジ推論モデルの導入と管理を担当するエッジデバイスマネージャとエッジサーバ管理者。
解決策アーキテクチャ
この解決策 は、GPUの処理能力と従来のCPUを併用することで、大規模なデータセットにおけるAIワークロードのリアルタイムおよびバッチ推論を処理するように設計されています。この検証では、MLのプライバシー保護推論と、責任のあるAI導入を求めている組織に必要な最適なデータ管理が実証されています。この解決策 は、エッジコンピューティングとクラウドコンピューティングを連携させる単一ノードまたはマルチノードのKubernetesプラットフォームに適したアーキテクチャを提供します。このプラットフォームは、オンプレミスのコアソフトウェアであるNetApp ONTAP AI、NetApp DataOpsツールキット、およびJupyter LabとCLIインターフェイスを使用したProtopia難読化ソフトウェアと連携します。次の図は、ネットアップのDataOpsツールキットとProtopiaを使用したデータファブリックの論理アーキテクチャの概要を示しています。
Protopia難読化ソフトウェアは、NetApp DataOpsツールキットの上でシームレスに実行され、ストレージサーバから離れる前にデータを変換します。