Configurare Oracle Linux 7.6 per FCP e iSCSI con storage ONTAP
Il software Linux host Utilities fornisce strumenti di gestione e diagnostica per gli host Linux connessi allo storage ONTAP. Quando si installa Linux Host Utilities su un host Oracle Linux 7.6, è possibile utilizzare Host Utilities per gestire le operazioni del protocollo FCP e iSCSI con LUN ONTAP.
|
Non è necessario configurare manualmente le impostazioni della macchina virtuale basata sul kernel (KVM) perché le LUN ONTAP vengono automaticamente mappate sull'hypervisor. |
Passaggio 1: Se lo si desidera, attivare l'avvio SAN
È possibile configurare l'host in modo che utilizzi l'avvio SAN per semplificare l'installazione e migliorare la scalabilità.
Utilizzare "Tool di matrice di interoperabilità"per verificare che il sistema operativo Linux, l'HBA (host Bus Adapter), il firmware HBA, il BIOS di avvio HBA e la versione ONTAP supportino l'avvio SAN.
-
Abilitare l'avvio SAN nel BIOS del server per le porte a cui è mappato il LUN di avvio SAN.
Per informazioni su come attivare il BIOS HBA, consultare la documentazione specifica del vendor.
-
Verificare che la configurazione sia stata eseguita correttamente riavviando l'host e verificando che il sistema operativo sia attivo e funzionante.
Fase 2: Installare le utilità host Linux
NetApp consiglia vivamente di installare le utilità host Linux per supportare la gestione LUN di ONTAP e fornire assistenza tecnica nella raccolta dei dati di configurazione.
|
L'installazione di Linux host Utilities non modifica le impostazioni di timeout dell'host sul proprio host Linux. |
Fase 3: Verificare la configurazione multipath per l'host
Puoi utilizzare multipathing con Oracle Linux 7,6 per gestire i LUN di ONTAP.
|
Puoi usare il "impostazioni consigliate per Red Hat Enterprise Linux (RHEL) 7.6" per configurare il kernel compatibile con Red Hat per Oracle Linux 7.6. |
Per verificare che il multipathing sia configurato correttamente per l'host, verificare che il /etc/multipath.conf
file sia definito e che siano configurate le impostazioni consigliate da NetApp per i LUN ONTAP.
-
Verificare che il
/etc/multipath.conf
file venga chiuso. Se il file non esiste, creare un file vuoto a zero byte:touch /etc/multipath.conf
-
La prima volta che
multipath.conf
si crea il file, potrebbe essere necessario attivare e avviare i servizi multipath per caricare le impostazioni consigliate:chkconfig multipathd on
/etc/init.d/multipathd start
-
Ogni volta che si avvia l'host, il file vuoto
/etc/multipath.conf
con zero byte carica automaticamente i parametri multipath dell'host raccomandati da NetApp come impostazioni predefinite. Non è necessario apportare modifiche al/etc/multipath.conf
file per l'host perché il sistema operativo è compilato con i parametri multipath che riconoscono e gestiscono correttamente i LUN ONTAP.La tabella seguente mostra le impostazioni dei parametri multipercorso compilati nativi del sistema operativo Linux per i LUN ONTAP.
Mostra impostazioni parametri
Parametro Impostazione detect_prio
sì
dev_loss_tmo
"infinito"
failback
immediato
fast_io_fail_tmo
5
caratteristiche
"2 pg_init_retries 50"
flush_on_last_del
"sì"
gestore_hardware
"0"
no_path_retry
coda
path_checker
"a"
policy_di_raggruppamento_percorsi
"group_by_prio"
path_selector
"tempo di servizio 0"
intervallo_polling
5
prio
"ONTAP"
prodotto
LUN
retain_attached_hw_handler
sì
peso_rr
"uniforme"
user_friendly_names
no
vendor
NETAPP
-
Verificare le impostazioni dei parametri e lo stato del percorso dei LUN ONTAP:
multipath -ll
I parametri multipath predefiniti supportano le configurazioni AFF e FAS. In queste configurazioni, una singola LUN ONTAP non deve richiedere più di quattro percorsi. Se sono presenti più di quattro percorsi, potrebbero verificarsi problemi con i percorsi durante un errore di storage.
Una configurazione AFF o FAS deve avere due gruppi di percorsi con priorità maggiore e minore. I percorsi Active/Optimized di priorità più elevata sono serviti dal controller in cui si trova l'aggregato. I percorsi a priorità inferiore sono attivi ma non ottimizzati perché serviti da un controller diverso. I percorsi non ottimizzati vengono utilizzati solo quando non sono disponibili percorsi ottimizzati.
Gli output di esempio seguenti mostrano le impostazioni corrette dei parametri e lo stato del percorso per le LUN ONTAP in una configurazione AFF o FAS con due percorsi attivi/ottimizzati e due percorsi attivi/non ottimizzati:
Mostra esempio
multipath -ll 3600a0980383036347ffb4d59646c4436 dm-28 NETAPP,LUN C-Mode size=10G features='3 queue_if_no_path pg_init_retries 50' hwhandler='1 alua' wp=rw |-+- policy='service-time 0' prio=50 status=active | |- 16:0:6:35 sdwb 69:624 active ready running | |- 16:0:5:35 sdun 66:752 active ready running `-+- policy='service-time 0' prio=10 status=enabled |- 15:0:0:35 sdaj 66:48 active ready running |- 15:0:1:35 sdbx 68:176 active ready running
Passaggio 4: Se si desidera, escludere un dispositivo dal multipathing
Se necessario, è possibile escludere un dispositivo dal multipathing aggiungendo il WWID per il dispositivo indesiderato alla stanza "blacklist" per il multipath.conf
file.
-
Determinare il WWID:
/lib/udev/scsi_id -gud /dev/sda
"sda" è il disco SCSI locale che si desidera aggiungere alla blacklist.
Un esempio di WWID è
360030057024d0730239134810c0cb833
. -
Aggiungere il WWID alla "blacklist" stanza:
blacklist { wwid 360030057024d0730239134810c0cb833 devnode "^(ram|raw|loop|fd|md|dm-|sr|scd|st)[0-9]*" devnode "^hd[a-z]" devnode "^cciss.*" }
Passaggio 5: Personalizzare i parametri multipath per i LUN ONTAP
Se l'host è connesso a LUN di altri fornitori e le impostazioni dei parametri multipath vengono sovrascritte, è necessario correggerle aggiungendo più avanti nel multipath.conf
file che si applicano specificamente ai LUN di ONTAP. In caso contrario, i LUN di ONTAP potrebbero non funzionare come previsto.
Controllare il file, in particolare nella sezione dei valori predefiniti, per verificare /etc/multipath.conf
le impostazioni che potrebbero sovrascrivere impostazioni predefinite per i parametri multipath.
|
Non sovrascrivere le impostazioni dei parametri consigliate per i LUN ONTAP. Queste impostazioni sono necessarie per ottenere prestazioni ottimali della configurazione host. Per ulteriori informazioni, contattare l'assistenza NetApp, il fornitore del sistema operativo o entrambi. |
Nell'esempio seguente viene illustrato come correggere un valore predefinito sovrascritto. In questo esempio, il multipath.conf
file definisce i valori per path_checker
e no_path_retry
che non sono compatibili con i LUN ONTAP e non è possibile rimuovere questi parametri perché gli array di storage ONTAP sono ancora collegati all'host. È invece possibile correggere i valori per path_checker
e no_path_retry
aggiungendo una stanza di dispositivo al multipath.conf
file che si applica specificamente ai LUN di ONTAP.
Mostra esempio
defaults { path_checker readsector0 no_path_retry fail } devices { device { vendor "NETAPP" product "LUN" no_path_retry queue path_checker tur } }
Fase 6: Esaminare i problemi noti
L'host Oracle Linux 7.6 con storage ONTAP presenta i seguenti problemi noti:
ID bug NetApp | Titolo | Descrizione |
---|---|---|
1440718 |
Se si dismappa o si mappa un LUN senza eseguire una nuova scansione SCSI, i dati sull'host potrebbero danneggiarsi. |
Quando si imposta il parametro di configurazione multipath 'disable_changed_wids' su YES, l'accesso al path device viene disattivato in caso di modifica dell'ID WWID. Multipath disattiva l'accesso al dispositivo di percorso fino a quando l'ID WWID del percorso non viene ripristinato all'ID WWID del dispositivo multipath. Per ulteriori informazioni, vedere "Knowledge base di NetApp: La corruzione del file system sul LUN iSCSI su Oracle Linux 7". |
I LUN potrebbero non essere disponibili durante il rilevamento dell'host a causa dello stato "non presente" delle porte remote su un host OL7U6 con adattatore QLogic QLE2742 |
Durante il rilevamento dell'host, lo stato delle porte remote Fibre Channel (FC) su un host OL7U6 con un adattatore QLogic QLE2742 potrebbe entrare nello stato "Not Present" (non presente). Le porte remote con stato "non presente" potrebbero rendere non disponibili i percorsi verso i LUN. Durante il failover dello storage, la ridondanza del percorso potrebbe essere ridotta e causare un'interruzione dell'i/O. È possibile controllare lo stato della porta remota immettendo il seguente comando: Cat /sys/class/fc_remote_ports/rport-*/port_state il seguente è un esempio dell'output visualizzato: Online non presente Online |
|
L'interruzione del kernel si verifica su Oracle Linux 7.6 con Qlogic (QLE2672) 16 GB FC HBA durante le operazioni di failover dello storage |
Durante le operazioni di failover dello storage su Oracle Linux 7.6 con un HBA (host bus adapter) Qlogic QLE2672 Fibre Channel (FC), si verifica un'interruzione del kernel a causa di un panico nel kernel. Il kernel panic causa il riavvio di Oracle Linux 7.6, con conseguente interruzione dell'applicazione. Se il meccanismo kdump è attivato, il kernel panic genera un file vmcore che si trova nella directory /var/crash/. È possibile analizzare il file vmcore per determinare la causa del panico. Dopo l'interruzione del kernel, è possibile riavviare il sistema operativo host e ripristinare il sistema operativo, quindi è possibile riavviare qualsiasi applicazione secondo necessità. |
|
Durante le operazioni di failover dello storage, è possibile che Oracle Linux 7.6 venga eseguito con Qlogic(QLE2742) 32GB FC HBA |
Durante le operazioni di failover dello storage su Oracle Linux 7.6 con un HBA (host bus adapter) Qlogic QLE2742 Fibre Channel (FC), potrebbe verificarsi un'interruzione del kernel a causa di un panico nel kernel. Il kernel panic causa il riavvio di Oracle Linux 7.6, con conseguente interruzione dell'applicazione. Se il meccanismo kdump è attivato, il kernel panic genera un file vmcore che si trova nella directory /var/crash/. È possibile analizzare il file vmcore per determinare la causa del panico. Dopo l'interruzione del kernel, è possibile riavviare il sistema operativo host e ripristinare il sistema operativo, quindi è possibile riavviare qualsiasi applicazione secondo necessità. |
|
Durante le operazioni di failover dello storage, è possibile che Oracle Linux 7.6 venga eseguito con Emulex (LPe32002-M2)32GB FC HBA |
Durante le operazioni di failover dello storage su Oracle Linux 7.6 con un HBA (host bus adapter) Fibre Channel Emulex LPe32002-M2, potrebbe verificarsi un'interruzione del kernel a causa di un panico nel kernel. Il kernel panic causa il riavvio di Oracle Linux 7.6, con conseguente interruzione dell'applicazione. Se il meccanismo kdump è attivato, il kernel panic genera un file vmcore che si trova nella directory /var/crash/. È possibile analizzare il file vmcore per determinare la causa del panico. Dopo l'interruzione del kernel, è possibile riavviare il sistema operativo host e ripristinare il sistema operativo, quindi è possibile riavviare qualsiasi applicazione secondo necessità. |
|
Nessun progresso i/o su Oracle Linux 7.6 con kernel UEK5U2, eseguito con un HBA FC Emulex LPe16002B-M6 16G durante le operazioni di failover dello storage |
Durante le operazioni di failover dello storage su Oracle Linux 7.6 con il kernel UEK5U2 in esecuzione con un HBA (host bus adapter) Fibre Channel 16G Emulex LPe16002B-M6, l'avanzamento dell'i/o potrebbe interrompersi a causa del blocco dei report. L'operazione di failover dello storage segnala il passaggio da uno stato "online" a uno "bloccato", causando un ritardo nelle operazioni di lettura e scrittura. Una volta completata correttamente l'operazione, i report non tornano allo stato "online" e continuano a rimanere nello stato "bloccato". |
|
Stato della porta remota sull'host QLogic QLE2672 16G bloccato durante le operazioni di failover dello storage |
Le porte remote Fibre Channel (FC) potrebbero essere bloccate su Red Hat Enterprise Linux (RHEL) 7.6 con l'host QLogic QLE2672 16G durante le operazioni di failover dello storage. Poiché le interfacce logiche si bloccano quando un nodo di storage è inattivo, le porte remote impostano lo stato del nodo di storage su bloccato. L'avanzamento dell'i/o potrebbe interrompersi a causa delle porte bloccate se si esegue sia un host QLogic QLE2672 16G che un HBA (host Bus Adapter) Fibre Channel (FC) da QLE2742 32GB GB. Quando il nodo di storage torna allo stato ottimale, vengono anche presentate le interfacce logiche e le porte remote devono essere in linea. Tuttavia, le porte remote potrebbero essere ancora bloccate. Questo stato bloccato viene registrato come guasto nelle LUN del layer multipath. Puoi verificare lo stato delle porte remote con il seguente comando: Cat /sys/class/fc_remote_ports/rport-*/port_stat dovresti visualizzare il seguente output: Blocked blocked blocked Online |
Quali sono le prossime novità?
-
"Informazioni sull'utilizzo dello strumento Linux host Utilities" .
-
Informazioni sul mirroring ASM.
Il mirroring ASM (Automatic Storage Management) potrebbe richiedere modifiche alle impostazioni del multipath Linux per consentire ad ASM di riconoscere un problema e passare a un gruppo di guasti alternativo. La maggior parte delle configurazioni ASM su ONTAP utilizza la ridondanza esterna, il che significa che la protezione dei dati viene fornita dall'array esterno e ASM non esegue il mirroring dei dati. Alcuni siti utilizzano ASM con ridondanza normale per fornire il mirroring bidirezionale, in genere su siti diversi. Per ulteriori informazioni, vedere"Database Oracle su ONTAP".