Visión general de la tecnología
Este artículo ofrece una visión general de la colución para canalización MLRun con IA de NetApp ONTAP, Plano de control de IA de NetApp, el software Cloud Volumes de NetApp y la plataforma de ciencia de datos de Iguazio.
Información general de NetApp
NetApp es un referente en materia de datos para el cloud híbrido. NetApp proporciona una gama completa de servicios de datos en el cloud híbrido que simplifican la gestión de aplicaciones y datos en entornos de cloud y en las instalaciones para acelerar la transformación digital. Junto con nuestros partners, NetApp permite a organizaciones globales aprovechar al máximo todo el potencial de sus datos para ampliar los puntos de contacto con los clientes, fomentar una mayor innovación y optimizar sus operaciones.
ONTAP AI de NetApp
ONTAP AI de NetApp, impulsado por los sistemas NVIDIA DGX y el almacenamiento all-flash conectado al cloud de NetApp, optimiza el flujo de datos con total confianza y acelera el análisis, la formación y la inferencia con su Data Fabric, que abarca desde el perímetro al núcleo y al cloud. Proporciona a las organizaciones DE TI una arquitectura que ofrece las siguientes ventajas:
-
Elimina las complejidades de diseño
-
Permite un escalado independiente de las capacidades de computación y almacenamiento
-
Permite a los clientes empezar con poco y escalar sin problemas
-
Ofrece una gama de opciones de almacenamiento para diferentes tipos de rendimiento y coste.ONTAP AI ofrece pilas de infraestructuras convergentes que incorporan NVIDIA DGX-1, un sistema de IA a escala de petaflops y switches Ethernet de alto rendimiento NVIDIA Mellanox para unificar cargas de trabajo de IA, simplificar la puesta en marcha y acelerar el retorno de la inversión. Para este informe técnico, hemos aprovechado la inteligencia artificial de ONTAP con un sistema de almacenamiento DGX-1 y AFF A800 de NetApp. En la siguiente imagen, se muestra la topología de ONTAP AI con el sistema DGX-1 utilizado en esta validación.
Plano de control de IA de NetApp
El plano de control de IA de NetApp permite aprovechar la IA Y EL APRENDIZAJE AUTOMÁTICO con una solución que ofrece una escalabilidad extrema, una puesta en marcha optimizada y una disponibilidad de datos ininterrumpida. La solución de plano de control de IA integra Kubernetes y Kubeflow con una estructura de datos habilitada por NetApp. Kubernetes, la plataforma de orquestación de contenedores estándar del sector para puestas en marcha nativas del cloud, permite la escalabilidad y la portabilidad de las cargas de trabajo. Kubeflow es una plataforma de aprendizaje automático de código abierto que simplifica la gestión y la puesta en marcha, lo que permite a los desarrolladores hacer más ciencia de datos en menos tiempo. Una estructura de datos habilitada por NetApp ofrece una disponibilidad y portabilidad de datos sin concesiones para garantizar que sus datos están accesibles en toda la canalización, desde el perímetro al núcleo y al cloud. En este informe técnico se utiliza el plano de control de IA de NetApp en una canalización MLRun. La siguiente imagen muestra la página de gestión de clústeres de Kubernetes, donde se pueden tener distintos extremos para cada clúster. Conectamos volúmenes persistentes NFS al clúster de Kubernetes, y las siguientes imágenes muestran un volumen persistente conectado al clúster, donde "Trident de NetApp" ofrece capacidades de gestión de datos y soporte de almacenamiento persistente.
Visión General de Iguazio
La Plataforma de Ciencias de datos de Iguazio es una plataforma de ciencia de datos como servicio (PaaS) totalmente integrada y segura que simplifica el desarrollo, acelera el rendimiento, facilita la colaboración y aborda los retos operativos. Esta plataforma incorpora los siguientes componentes, y la Plataforma de Ciencias de datos de Iguazio se presenta en la siguiente imagen:
-
Banco de trabajo de ciencia de datos que incluye portátiles Juppyter, motores de análisis integrados y paquetes Python
-
Gestión de modelos con seguimiento de experimentos y funcionalidades de canalizaciones automatizadas
-
Datos gestionados y servicios ML a través de un clúster de Kubernetes escalable
-
Nuclio, un marco de funciones sin servidor en tiempo real
-
Una capa de datos extremadamente rápida y segura compatible con SQL, NoSQL, bases de datos de series temporales, archivos (objetos sencillos) y streaming
-
Integración con fuentes de datos de terceros como NetApp, Amazon S3, HDFS, bases de datos de SQL y protocolos de transmisión o mensajería
-
Paneles en tiempo real basados en Grafana