Beheben von Netzwerk-, Hardware- und Plattformproblemen
Sie können verschiedene Aufgaben ausführen, um die Ursache von Problemen im Zusammenhang mit dem StorageGRID -Netzwerk, der Hardware und der Plattform zu ermitteln.
Fehler „422: Nicht verarbeitbare Entität“
Der Fehler 422: Unprocessable Entity kann aus verschiedenen Gründen auftreten. Überprüfen Sie die Fehlermeldung, um die Ursache Ihres Problems zu ermitteln.
Wenn Sie eine der aufgeführten Fehlermeldungen sehen, ergreifen Sie die empfohlene Maßnahme.
Fehlermeldung | Grundursache und Korrekturmaßnahmen |
---|---|
422: Unprocessable Entity Validation failed. Please check the values you entered for errors. Test connection failed. Please verify your configuration. Unable to authenticate, please verify your username and password: LDAP Result Code 8 "Strong Auth Required": 00002028: LdapErr: DSID-0C090256, comment: The server requires binds to turn on integrity checking if SSL\TLS are not already active on the connection, data 0, v3839 |
Diese Meldung kann auftreten, wenn Sie beim Konfigurieren der Identitätsföderation mit Windows Active Directory (AD) die Option TLS nicht verwenden für Transport Layer Security (TLS) auswählen. Die Verwendung der Option TLS nicht verwenden wird für die Verwendung mit AD-Servern, die eine LDAP-Signatur erzwingen, nicht unterstützt. Sie müssen entweder die Option STARTLS verwenden oder die Option LDAPS verwenden für TLS auswählen. |
422: Unprocessable Entity Validation failed. Please check the values you entered for errors. Test connection failed. Please verify your configuration.Unable to begin TLS, verify your certificate and TLS configuration: LDAP Result Code 200 "Network Error": TLS handshake failed (EOF) |
Diese Meldung wird angezeigt, wenn Sie versuchen, eine nicht unterstützte Verschlüsselung zu verwenden, um eine Transport Layer Security (TLS)-Verbindung von StorageGRID zu einem externen System herzustellen, das zur Identifizierung der Föderation oder von Cloud-Speicherpools verwendet wird. Überprüfen Sie die vom externen System angebotenen Chiffren. Das System muss eines der"Von StorageGRID unterstützte Chiffren" für ausgehende TLS-Verbindungen, wie in der Anleitung zur Administration von StorageGRID beschrieben. |
MTU-Nichtübereinstimmungswarnung im Netznetzwerk
Die Warnung MTU-Fehlanpassung im Grid-Netzwerk wird ausgelöst, wenn die Einstellung der maximalen Übertragungseinheit (MTU) für die Grid-Netzwerkschnittstelle (eth0) zwischen den Knoten im Grid erheblich abweicht.
Die Unterschiede in den MTU-Einstellungen könnten darauf hinweisen, dass einige, aber nicht alle eth0-Netzwerke für Jumbo Frames konfiguriert sind. Eine Nichtübereinstimmung der MTU-Größe von mehr als 1000 kann zu Problemen mit der Netzwerkleistung führen.
-
Listen Sie die MTU-Einstellungen für eth0 auf allen Knoten auf.
-
Verwenden Sie die im Grid Manager bereitgestellte Abfrage.
-
Navigieren Sie zu
primary Admin Node IP address/metrics/graph
und geben Sie die folgende Abfrage ein:node_network_mtu_bytes{device="eth0"}
-
-
"Ändern Sie die MTU-Einstellungen"nach Bedarf, um sicherzustellen, dass sie für die Grid-Netzwerkschnittstelle (eth0) auf allen Knoten gleich sind.
-
Verwenden Sie für Linux- und VMware-basierte Knoten den folgenden Befehl:
/usr/sbin/change-ip.py [-h] [-n node] mtu network [network...]
Beispiel:
change-ip.py -n node 1500 grid admin
Hinweis: Wenn auf Linux-basierten Knoten der gewünschte MTU-Wert für das Netzwerk im Container den bereits auf der Hostschnittstelle konfigurierten Wert überschreitet, müssen Sie zuerst die Hostschnittstelle so konfigurieren, dass sie den gewünschten MTU-Wert hat, und dann die
change-ip.py
Skript zum Ändern des MTU-Werts des Netzwerks im Container.Verwenden Sie die folgenden Argumente zum Ändern der MTU auf Linux- oder VMware-basierten Knoten.
Positionsargumente Beschreibung mtu
Die einzustellende MTU. Muss im Bereich von 1280 bis 9216 liegen.
network
Die Netzwerke, auf die die MTU angewendet werden soll. Schließen Sie einen oder mehrere der folgenden Netzwerktypen ein:
-
Netz
-
Administrator
-
Kunde
+
Optionale Argumente Beschreibung -h, – help
Zeigen Sie die Hilfemeldung an und beenden Sie das Programm.
-n node, --node node
Der Knoten. Der Standard ist der lokale Knoten.
-
Knotennetzwerk-Empfangsframe-Fehlerwarnung
Fehler beim Empfang des Knotennetzwerk-Frames-Warnungen können durch Verbindungsprobleme zwischen StorageGRID und Ihrer Netzwerkhardware verursacht werden. Diese Warnung wird von selbst gelöscht, nachdem das zugrunde liegende Problem behoben wurde.
Fehler beim Empfang des Knotennetzwerk-Frames-Warnungen können durch die folgenden Probleme mit der Netzwerkhardware verursacht werden, die eine Verbindung zu StorageGRID herstellt:
-
Vorwärtsfehlerkorrektur (FEC) ist erforderlich und wird nicht verwendet
-
Switch-Port und NIC-MTU stimmen nicht überein
-
Hohe Link-Fehlerraten
-
NIC-Ringpufferüberlauf
-
Befolgen Sie die Schritte zur Fehlerbehebung für alle möglichen Ursachen dieser Warnung in Ihrer Netzwerkkonfiguration.
-
Führen Sie je nach Fehlerursache folgende Schritte durch:
FEC-FehlanpassungDiese Schritte gelten nur für Warnungen vom Typ „Knotennetzwerk-Empfangsframefehler“*, die durch eine FEC-Nichtübereinstimmung auf StorageGRID -Geräten verursacht werden. -
Überprüfen Sie den FEC-Status des Ports im Switch, der an Ihr StorageGRID Gerät angeschlossen ist.
-
Überprüfen Sie die physische Integrität der Kabel vom Gerät zum Switch.
-
Wenn Sie die FEC-Einstellungen ändern möchten, um zu versuchen, die Warnung zu beheben, stellen Sie zunächst sicher, dass das Gerät auf der Seite „Link-Konfiguration“ des StorageGRID Appliance Installer für den Modus „Auto“ konfiguriert ist (siehe die Anweisungen für Ihr Gerät:
-
Ändern Sie die FEC-Einstellungen an den Switch-Ports. Die Ports der StorageGRID Appliance passen ihre FEC-Einstellungen nach Möglichkeit entsprechend an.
Sie können keine FEC-Einstellungen auf StorageGRID -Geräten konfigurieren. Stattdessen versuchen die Geräte, die FEC-Einstellungen an den Switch-Ports zu ermitteln und zu spiegeln, mit denen sie verbunden sind. Wenn die Verbindungen auf Netzwerkgeschwindigkeiten von 25 GbE oder 100 GbE gezwungen werden, können Switch und NIC möglicherweise keine gemeinsame FEC-Einstellung aushandeln. Ohne eine gemeinsame FEC-Einstellung fällt das Netzwerk in den „No-FEC“-Modus zurück. Wenn FEC nicht aktiviert ist, sind die Verbindungen anfälliger für Fehler, die durch elektrisches Rauschen verursacht werden.
StorageGRID Geräte unterstützen Firecode (FC) und Reed Solomon (RS) FEC sowie kein FEC.
Switch-Port und NIC-MTU stimmen nicht übereinWenn die Warnung durch eine Nichtübereinstimmung von Switch-Port und NIC-MTU verursacht wird, überprüfen Sie, ob die auf dem Knoten konfigurierte MTU-Größe mit der MTU-Einstellung für den Switch-Port übereinstimmt.
Die auf dem Knoten konfigurierte MTU-Größe ist möglicherweise kleiner als die Einstellung auf dem Switch-Port, mit dem der Knoten verbunden ist. Wenn ein StorageGRID Knoten einen Ethernet-Frame empfängt, der größer ist als seine MTU (was bei dieser Konfiguration möglich ist), wird möglicherweise die Warnung Fehler beim Empfang des Frames im Knotennetzwerk gemeldet. Wenn Sie glauben, dass dies der Fall ist, ändern Sie entweder die MTU des Switch-Ports, sodass sie mit der MTU der StorageGRID Netzwerkschnittstelle übereinstimmt, oder ändern Sie die MTU der StorageGRID -Netzwerkschnittstelle, sodass sie mit dem Switch-Port übereinstimmt, je nach Ihren End-to-End-MTU-Zielen oder -Anforderungen.
Für eine optimale Netzwerkleistung sollten alle Knoten mit ähnlichen MTU-Werten auf ihren Grid-Netzwerkschnittstellen konfiguriert werden. Die Warnung MTU-Fehlanpassung des Grid-Netzwerks wird ausgelöst, wenn es bei den MTU-Einstellungen für das Grid-Netzwerk auf einzelnen Knoten einen signifikanten Unterschied gibt. Die MTU-Werte müssen nicht für alle Netzwerktypen gleich sein. Sehen Fehlerbehebung bei der Warnung „MTU-Fehlanpassung im Grid-Netzwerk“ für weitere Informationen. Siehe auch "MTU-Einstellung ändern" . Hohe Link-Fehlerraten-
Aktivieren Sie FEC, falls noch nicht geschehen.
-
Stellen Sie sicher, dass Ihre Netzwerkverkabelung von guter Qualität ist und nicht beschädigt oder falsch angeschlossen ist.
-
Wenn die Kabel nicht das Problem zu sein scheinen, wenden Sie sich an den technischen Support.
In einer Umgebung mit starkem elektrischen Rauschen stellen Sie möglicherweise hohe Fehlerraten fest.
NIC-RingpufferüberlaufWenn der Fehler auf einen Überlauf des NIC-Ringpuffers zurückzuführen ist, wenden Sie sich an den technischen Support.
Der Ringpuffer kann überlaufen, wenn das StorageGRID -System überlastet ist und Netzwerk-Ereignisse nicht rechtzeitig verarbeiten kann.
-
-
Beobachten Sie das Problem und wenden Sie sich an den technischen Support, wenn die Warnung nicht behoben wird.
Zeitsynchronisierungsfehler
Möglicherweise treten Probleme mit der Zeitsynchronisierung in Ihrem Raster auf.
Wenn bei der Zeitsynchronisierung Probleme auftreten, überprüfen Sie, ob Sie mindestens vier externe NTP-Quellen angegeben haben, die jeweils eine Stratum 3-Referenz oder besser bereitstellen, und ob alle externen NTP-Quellen normal funktionieren und von Ihren StorageGRID Knoten aus zugänglich sind.
|
Wann"Angabe der externen NTP-Quelle" Verwenden Sie für eine StorageGRID Installation auf Produktionsebene den Windows-Zeitdienst (W32Time) nicht auf einer Windows-Version vor Windows Server 2016. Der Zeitdienst früherer Windows-Versionen ist nicht genau genug und wird von Microsoft für die Verwendung in Umgebungen mit hoher Genauigkeit, wie z. B. StorageGRID, nicht unterstützt. |
Linux: Probleme mit der Netzwerkverbindung
Möglicherweise treten Probleme mit der Netzwerkkonnektivität für StorageGRID -Knoten auf, die auf Linux-Hosts gehostet werden.
Klonen von MAC-Adressen
In einigen Fällen können Netzwerkprobleme durch das Klonen von MAC-Adressen gelöst werden. Wenn Sie virtuelle Hosts verwenden, setzen Sie den Wert des MAC-Adressklonschlüssels für jedes Ihrer Netzwerke in Ihrer Knotenkonfigurationsdatei auf „true“. Diese Einstellung bewirkt, dass die MAC-Adresse des StorageGRID -Containers die MAC-Adresse des Hosts verwendet. Informationen zum Erstellen von Knotenkonfigurationsdateien finden Sie in den Anweisungen für"Red Hat Enterprise Linux" oder"Ubuntu oder Debian" .
|
Erstellen Sie separate virtuelle Netzwerkschnittstellen zur Verwendung durch das Linux-Hostbetriebssystem. Die Verwendung derselben Netzwerkschnittstellen für das Linux-Hostbetriebssystem und den StorageGRID Container kann dazu führen, dass das Hostbetriebssystem nicht mehr erreichbar ist, wenn der Promiscuous-Modus auf dem Hypervisor nicht aktiviert wurde. |
Weitere Informationen zum Aktivieren des MAC-Klonens finden Sie in den Anweisungen für"Red Hat Enterprise Linux" oder"Ubuntu oder Debian" .
Promiscuous-Modus
Wenn Sie das Klonen von MAC-Adressen nicht verwenden möchten und lieber allen Schnittstellen das Empfangen und Senden von Daten für andere MAC-Adressen als die vom Hypervisor zugewiesenen erlauben möchten, stellen Sie sicher, dass die Sicherheitseigenschaften auf der Ebene des virtuellen Switches und der Portgruppe für den Promiscuous-Modus, MAC-Adressänderungen und gefälschte Übertragungen auf Akzeptieren eingestellt sind. Die auf dem virtuellen Switch festgelegten Werte können durch die Werte auf Portgruppenebene überschrieben werden. Stellen Sie daher sicher, dass die Einstellungen an beiden Stellen identisch sind.
Weitere Informationen zur Verwendung des Promiscuous-Modus finden Sie in den Anweisungen für"Red Hat Enterprise Linux" oder"Ubuntu oder Debian" .
Linux: Knotenstatus ist „verwaist“
Ein Linux-Knoten in einem verwaisten Zustand weist normalerweise darauf hin, dass entweder der StorageGrid-Dienst oder der StorageGRID -Knoten-Daemon, der den Container des Knotens steuert, unerwartet beendet wurde.
Wenn ein Linux-Knoten meldet, dass er sich in einem verwaisten Zustand befindet, sollten Sie:
-
Überprüfen Sie die Protokolle auf Fehler und Nachrichten.
-
Versuchen Sie, den Knoten erneut zu starten.
-
Verwenden Sie bei Bedarf Container-Engine-Befehle, um den vorhandenen Knotencontainer zu stoppen.
-
Starten Sie den Knoten neu.
-
Überprüfen Sie die Protokolle sowohl für den Service-Daemon als auch für den verwaisten Knoten auf offensichtliche Fehler oder Meldungen über ein unerwartetes Beenden.
-
Melden Sie sich beim Host als Root oder mit einem Konto mit Sudo-Berechtigung an.
-
Versuchen Sie, den Knoten erneut zu starten, indem Sie den folgenden Befehl ausführen:
$ sudo storagegrid node start node-name
$ sudo storagegrid node start DC1-S1-172-16-1-172
Wenn der Knoten verwaist ist, lautet die Antwort
Not starting ORPHANED node DC1-S1-172-16-1-172
-
Stoppen Sie unter Linux die Container-Engine und alle steuernden StorageGrid-Node-Prozesse. Beispiel:
sudo docker stop --time secondscontainer-name
Für
seconds
Geben Sie die Anzahl der Sekunden ein, die Sie warten möchten, bis der Container stoppt (normalerweise 15 Minuten oder weniger). Beispiel:sudo docker stop --time 900 storagegrid-DC1-S1-172-16-1-172
-
Starten Sie den Knoten neu:
storagegrid node start node-name
storagegrid node start DC1-S1-172-16-1-172
Linux: Fehlerbehebung bei der IPv6-Unterstützung
Möglicherweise müssen Sie die IPv6-Unterstützung im Kernel aktivieren, wenn Sie StorageGRID -Knoten auf Linux-Hosts installiert haben und feststellen, dass den Knotencontainern nicht wie erwartet IPv6-Adressen zugewiesen wurden.
So zeigen Sie die einem Grid-Knoten zugewiesene IPv6-Adresse an:
-
Wählen Sie NODES und wählen Sie den Knoten aus.
-
Wählen Sie auf der Registerkarte „Übersicht“ neben „IP-Adressen“ die Option „Zusätzliche IP-Adressen anzeigen“ aus.
Wenn die IPv6-Adresse nicht angezeigt wird und der Knoten auf einem Linux-Host installiert ist, führen Sie diese Schritte aus, um die IPv6-Unterstützung im Kernel zu aktivieren.
-
Melden Sie sich beim Host als Root oder mit einem Konto mit Sudo-Berechtigung an.
-
Führen Sie den folgenden Befehl aus:
sysctl net.ipv6.conf.all.disable_ipv6
root@SG:~ # sysctl net.ipv6.conf.all.disable_ipv6
Das Ergebnis sollte 0 sein.
net.ipv6.conf.all.disable_ipv6 = 0
Wenn das Ergebnis nicht 0 ist, lesen Sie in der Dokumentation Ihres Betriebssystems nach, um sysctl
Einstellungen. Ändern Sie dann den Wert auf 0, bevor Sie fortfahren. -
Geben Sie den StorageGRID -Knotencontainer ein:
storagegrid node enter node-name
-
Führen Sie den folgenden Befehl aus:
sysctl net.ipv6.conf.all.disable_ipv6
root@DC1-S1:~ # sysctl net.ipv6.conf.all.disable_ipv6
Das Ergebnis sollte 1 sein.
net.ipv6.conf.all.disable_ipv6 = 1
Wenn das Ergebnis nicht 1 ist, gilt dieses Verfahren nicht. Wenden Sie sich an den technischen Support. -
Verlassen Sie den Container:
exit
root@DC1-S1:~ # exit
-
Bearbeiten Sie als Root die folgende Datei:
/var/lib/storagegrid/settings/sysctl.d/net.conf
.sudo vi /var/lib/storagegrid/settings/sysctl.d/net.conf
-
Suchen Sie die folgenden zwei Zeilen und entfernen Sie die Kommentar-Tags. Speichern und schließen Sie dann die Datei.
net.ipv6.conf.all.disable_ipv6 = 0
net.ipv6.conf.default.disable_ipv6 = 0
-
Führen Sie diese Befehle aus, um den StorageGRID Container neu zu starten:
storagegrid node stop node-name
storagegrid node start node-name