Skip to main content
Se proporciona el idioma español mediante traducción automática para su comodidad. En caso de alguna inconsistencia, el inglés precede al español.

¿Qué es un nodo de almacenamiento?

Colaboradores netapp-lhalbert netapp-perveilerk

Los nodos de almacenamiento gestionan y almacenan metadatos y datos de objetos. Los nodos de almacenamiento incluyen los servicios y procesos necesarios para almacenar, mover, verificar y recuperar datos y metadatos de objetos en el disco.

Cada sitio del sistema StorageGRID debe tener al menos tres nodos de almacenamiento.

Tipos de nodos de almacenamiento

Durante la instalación, puede seleccionar el tipo de nodo de almacenamiento que desea instalar. Estos tipos están disponibles para nodos de almacenamiento basados en software y para nodos de almacenamiento basados en dispositivos compatibles con la función:

  • Combinación de datos y metadatos Storage Node

  • Nodo de almacenamiento solo de metadatos

  • Nodo de almacenamiento de solo datos

Puede seleccionar el tipo de nodo de almacenamiento en estas situaciones:

  • Cuando instala inicialmente un nodo de almacenamiento

  • Cuando se añade un nodo de almacenamiento durante la ampliación del sistema StorageGRID

Nodo de almacenamiento de datos y metadatos (combinado)

De forma predeterminada, todos los nodos de almacenamiento nuevos almacenarán tanto datos como metadatos de objetos. Este tipo de nodo de almacenamiento se denomina nodo de almacenamiento Combinado.

Nodo de almacenamiento solo de metadatos

El uso exclusivo de un nodo de almacenamiento para metadatos puede tener sentido si el grid almacena una gran cantidad de objetos pequeños. La instalación de capacidad de metadatos dedicada proporciona un mejor equilibrio entre el espacio necesario para una gran cantidad de objetos pequeños y el espacio necesario para los metadatos de esos objetos. Además, los nodos de almacenamiento solo de metadatos alojados en dispositivos de alto rendimiento pueden aumentar el rendimiento.

Los nodos de almacenamiento solo de metadatos tienen requisitos de hardware específicos:

  • Cuando se usan dispositivos StorageGRID, los nodos solo de metadatos se pueden configurar en dispositivos SGF6112 con doce unidades de 1,9 TB o doce de 3,8 TB.

  • Cuando se usan nodos basados en software, los recursos de nodos de solo metadatos deben coincidir con los recursos de nodos de almacenamiento existentes. Por ejemplo:

    • Si el sitio de StorageGRID existente utiliza dispositivos SG6000 o SG6100, los nodos de solo metadatos basados en software deben cumplir con los siguientes requisitos mínimos:

      • 128 GB DE MEMORIA RAM

      • CPU de 8 núcleos

      • SSD de 8 TB o almacenamiento equivalente para la base de datos Cassandra (rangedb/0)

    • Si el sitio StorageGRID existente utiliza nodos de almacenamiento virtuales con 24 GB de RAM, CPU de 8 núcleos y 3 TB o 4 TB de almacenamiento de metadatos, los nodos solo de metadatos basados ​​en software deben usar recursos similares (24 GB de RAM, CPU de 8 núcleos y 4 TB de almacenamiento de metadatos (rangedb/0)).

  • Al agregar un nuevo sitio de StorageGRID , la capacidad total de metadatos del nuevo sitio debe, como mínimo, coincidir con la de los sitios existentes. Los recursos de un nuevo sitio deben coincidir con los nodos de almacenamiento de los sitios existentes.

Nota Aunque los nodos de almacenamiento solo de metadatos contienen Servicio LDRy pueden procesar solicitudes de clientes de S3, es posible que el rendimiento de la StorageGRID no aumente.

Nodo de almacenamiento de solo datos

El uso exclusivo de un nodo de almacenamiento para los datos puede ser lógico si los nodos de almacenamiento tienen diferentes características de rendimiento. Por ejemplo, para aumentar potencialmente el rendimiento, podría tener nodos de almacenamiento en disco giratorio de alta capacidad y solo de datos acompañados por nodos de almacenamiento de alto rendimiento solo de metadatos.

Además, puede obtener más capacidad de metadatos eliminando nodos con poca RAM de Cassandra, lo que aumenta el límite de capacidad de metadatos por nodo. Consulte "Gestione el almacenamiento de metadatos de objetos" .

Puede convertir un nodo de almacenamiento que no contenga elServicio ADC a un nodo de almacenamiento de solo datos. Consulte "Convertir un nodo de almacenamiento en un nodo de solo datos" .

Nodos de almacenamiento necesarios por red y por sitio

Al seleccionar qué nodos de almacenamiento utilizar en su topología, tenga en cuenta que la cuadrícula o cada sitio en la cuadrícula debe contener lo siguiente:

  • Por sitio (en una cuadrícula de uno o varios sitios): TresADC Nodos de almacenamiento (pueden ser cualquier combinación de nodos de almacenamiento combinados y de solo metadatos)

  • Cuadrícula de un solo sitio: al menos dos nodos de almacenamiento de objetos (pueden ser cualquier combinación de nodos combinados y de solo datos)

  • Cuadrícula de varios sitios: al menos un nodo de almacenamiento de objetos por sitio (puede ser combinado o solo de datos)

Servicios principales para nodos de almacenamiento

En la siguiente tabla se muestran los servicios principales de los nodos de almacenamiento; sin embargo, esta tabla no enumera todos los servicios de los nodos.

Nota Algunos servicios, como el servicio ADC y el servicio RSM, normalmente solo existen en tres nodos de almacenamiento de cada sitio.
Servicio Función de la tecla

Cuenta (acct)

Administra cuentas de arrendatario.

Los nodos de almacenamiento de solo datos no alojan este servicio.

Controlador de dominio administrativo (ADC)

Mantiene la topología y la configuración en todo el grid.

Los nodos de almacenamiento de solo datos no alojan este servicio.

Detalles

El servicio de controlador de dominio administrativo (ADC) autentica los nodos de grid y sus conexiones entre sí. El servicio ADC está alojado en un mínimo de tres nodos de almacenamiento en un sitio.

El servicio ADC mantiene la información de topología, incluida la ubicación y disponibilidad de los servicios. Cuando un nodo de cuadrícula requiere información de otro nodo de cuadrícula o una acción que debe realizar otro nodo de cuadrícula, se pone en contacto con un servicio de ADC para encontrar el mejor nodo de cuadrícula para procesar su solicitud. Además, el servicio ADC conserva una copia de los paquetes de configuración de la implementación de StorageGRID, lo que permite que cualquier nodo de grid recupere la información de configuración actual.

Para facilitar las operaciones distribuidas e iaterradas, cada servicio ADC sincroniza certificados, paquetes de configuración e información sobre servicios y topología con los otros servicios ADC del sistema StorageGRID.

En general, todos los nodos de grid mantienen una conexión al menos a un servicio de ADC. De este modo se garantiza que los nodos grid accedan siempre a la información más reciente. Cuando los nodos de grid se conectan, almacenan en caché los certificados de otros nodos de grid, lo que permite que los sistemas continúen funcionando con los nodos de grid conocidos incluso cuando un servicio ADC no está disponible. Los nuevos nodos de grid solo pueden establecer conexiones mediante un servicio ADC.

La conexión de cada nodo de cuadrícula permite al servicio ADC recopilar información de topología. Esta información sobre los nodos de grid incluye la carga de CPU, el espacio en disco disponible (si tiene almacenamiento), los servicios admitidos y el ID de sitio del nodo de grid. Otros servicios solicitan al servicio ADC información de topología a través de consultas de topología. El servicio ADC responde a cada consulta con la información más reciente recibida del sistema StorageGRID.

Cassandra

Almacena y protege los metadatos de objetos.

Los nodos de almacenamiento de solo datos no alojan este servicio.

Cassandra Reaper

Realiza reparaciones automáticas de metadatos de objetos.

Los nodos de almacenamiento de solo datos no alojan este servicio.

Segmento

Gestiona datos codificados de borrado y fragmentos de paridad.

Transmisor de datos (dmv)

Transfiere datos a Cloud Storage Pools.

Almacén de datos distribuidos (DDS)

Supervisa el almacenamiento de metadatos de objetos.

Detalles

Cada nodo de almacenamiento incluye el servicio de almacén de datos distribuidos (DDS). Este servicio interactúa con la base de datos Cassandra para realizar tareas en segundo plano sobre los metadatos de objetos almacenados en el sistema StorageGRID.

El servicio DDS realiza un seguimiento del número total de objetos ingeridos en el sistema StorageGRID, así como del número total de objetos ingeridos a través de cada una de las interfaces soportadas por el sistema (S3).

Identidad (no)

Federe las identidades de usuario de LDAP y Active Directory.

Los nodos de almacenamiento de solo datos no alojan este servicio.

Router de distribución local (LDR)

Procesa las solicitudes del protocolo de almacenamiento de objetos y gestiona los datos de objetos en el disco.

Detalles

Cada nodo de almacenamiento combined, data-only y metadata-only incluye el servicio de enrutador de distribución local (LDR). Este servicio se encarga de las funciones de transporte de contenido, incluido el almacenamiento de datos, el enrutamiento y la gestión de solicitudes. El servicio LDR hace la mayor parte del trabajo duro del sistema StorageGRID al manejar las cargas de transferencia de datos y las funciones de tráfico de datos.

El servicio LDR se encarga de las siguientes tareas:

  • Consultas

  • Actividad de gestión de la vida útil de la información (ILM)

  • Eliminación de objetos

  • Almacenamiento de datos de objetos

  • Transferencias de datos de objetos desde otro servicio LDR (nodo de almacenamiento)

  • Gestión del almacenamiento de datos

  • Interfaz de protocolo S3

El servicio LDR también asigna cada objeto de S3 a su UUID único.

Almacenes de objetos

El almacenamiento de datos subyacente de un servicio LDR se divide en un número fijo de almacenes de objetos (también conocidos como volúmenes de almacenamiento). Cada almacén de objetos es un punto de montaje independiente.

Los almacenes de objetos de un nodo de almacenamiento se identifican mediante un número hexadecimal entre 0000 y 002F, que se conoce como el ID del volumen. El espacio se reserva en el primer almacén de objetos (volumen 0) para los metadatos de objetos en una base de datos de Cassandra; todo el espacio restante en ese volumen se usa para los datos de objetos. El resto de almacenes de objetos se utilizan exclusivamente para datos de objetos, lo que incluye copias replicadas y fragmentos codificados para borrado.

Para garantizar hasta el uso de espacio para las copias replicadas, los datos de objetos para un objeto determinado se almacenan en un almacén de objetos en función del espacio de almacenamiento disponible. Cuando un almacén de objetos se llena de capacidad, los almacenes de objetos restantes continúan almacenando objetos hasta que no haya más espacio en el nodo de almacenamiento.

Protección de metadatos

StorageGRID almacena metadatos de objetos en una base de datos de Cassandra, que se conecta con el servicio LDR.

Para garantizar la redundancia y, por lo tanto, la protección contra la pérdida, se mantienen tres copias de metadatos de objetos en cada sitio. Esta replicación no puede configurarse y se realiza de forma automática. Para obtener más información, consulte "Gestione el almacenamiento de metadatos de objetos".

Máquina de estado replicada (RSM)

Garantiza que las solicitudes de servicios de la plataforma S3 se envíen a sus respectivos puntos finales.

Los nodos de almacenamiento de solo datos no alojan este servicio.

Monitor de estado del servidor (SSM)

Supervisa el sistema operativo y el hardware subyacente.