Récupérer après une panne de nœud de stockage
La procédure de récupération d’un nœud de stockage défaillant dépend du type de défaillance et du type de nœud de stockage défaillant.
Utilisez ce tableau pour sélectionner la procédure de récupération pour un nœud de stockage défaillant.
Problème | Action | Remarques |
---|---|---|
|
Contactez le support technique. |
La récupération de plusieurs nœuds de stockage (ou de plusieurs nœuds de stockage dans un délai de 15 jours) peut affecter l'intégrité de la base de données Cassandra, ce qui peut entraîner une perte de données. Le support technique peut déterminer quand il est possible de commencer la récupération d’un deuxième nœud de stockage en toute sécurité. Remarque : si plusieurs nœuds de stockage contenant le service ADC échouent sur un site, vous perdez toutes les demandes de service de plateforme en attente pour ce site. |
Plusieurs nœuds de stockage sur un site sont tombés en panne ou un site entier est tombé en panne. |
Contactez le support technique. Il peut être nécessaire d’effectuer une procédure de récupération de site. |
Le support technique évaluera votre situation et élaborera un plan de récupération. Voir "Comment le support technique récupère un site" . |
Un nœud de stockage d’appareil est en panne. |
La procédure de récupération des nœuds de stockage de l'appliance est la même pour toutes les pannes. |
|
Un ou plusieurs volumes de stockage sont tombés en panne, mais le lecteur système est intact |
Cette procédure est utilisée pour les nœuds de stockage basés sur des logiciels. |
|
Le lecteur système est en panne. |
La procédure de remplacement du nœud dépend de la plate-forme de déploiement et de la défaillance éventuelle de volumes de stockage. |
|
Certaines procédures de récupération StorageGRID utilisent Reaper pour gérer les réparations Cassandra. Les réparations se produisent automatiquement dès que les services concernés ou requis ont commencé. Vous remarquerez peut-être une sortie de script qui mentionne « reaper » ou « réparation Cassandra ». Si vous voyez un message d’erreur indiquant que la réparation a échoué, exécutez la commande indiquée dans le message d’erreur. |