Skip to main content
Enterprise applications
La versione in lingua italiana fornita proviene da una traduzione automatica. Per eventuali incoerenze, fare riferimento alla versione in lingua inglese.

Timeout RAC

Collaboratori kaminis85

Oracle RAC è un prodotto clusterware con diversi tipi di processi heartbeat interni che monitorano lo stato del cluster.

I sistemi ASA r2 utilizzano ONTAP proprio come AFF/ FAS, quindi gli stessi principi si applicano ai parametri di timeout di Oracle RAC. Non ci sono modifiche specifiche ASA alle raccomandazioni disktimeout o misscount. Tuttavia, ASA r2 è ottimizzato per carichi di lavoro SAN e failover a bassa latenza, il che rende queste best practice ancora più critiche.

Nota Le informazioni nel "errore di montaggio" La sezione include informazioni critiche per gli ambienti Oracle RAC che utilizzano storage in rete e, in molti casi, sarà necessario modificare le impostazioni predefinite di Oracle RAC per garantire che il cluster RAC sopravviva alle modifiche del percorso di rete e alle operazioni di failover dello storage.

disktimeout

Il parametro RAC relativo allo storage primario è disktimeout. Questo parametro controlla la soglia entro la quale l'i/o del file di voting deve essere completato. Se il disktimeout Il parametro viene superato, quindi il nodo RAC viene eliminato dal cluster. Il valore predefinito per questo parametro è 200. Questo valore dovrebbe essere sufficiente per le procedure standard di takeover e giveback dello storage.

NetApp consiglia di eseguire il test approfondito delle configurazioni RAC prima di metterle in produzione, perché molti fattori influiscono su un takeover o un giveback. Oltre al tempo richiesto per il completamento del failover dello storage, è necessario ulteriore tempo affinché le modifiche LACP (link Aggregation Control Protocol) vengano propagate. Inoltre, il software multipathing SAN deve rilevare un timeout i/o e riprovare su un percorso alternativo. Se un database è estremamente attivo, è necessario accodare e rieseguire una grande quantità di i/o prima di elaborare l'i/o del disco di voting.

Nel caso in cui non sia possibile eseguire un takeover o un giveback effettivo dello storage, l'effetto può essere simulato con test di pull dei cavi sul server di database.

Suggerimento

NetApp consiglia quanto segue:

  • Lasciando il disktimeout parametro al valore predefinito di 200.

  • Verificare sempre accuratamente la configurazione di un RAC.

errore di montaggio

Il misscount In genere, il parametro influisce solo sull'heartbeat di rete tra i nodi RAC. Il valore predefinito è 30 secondi. Se i binari della griglia si trovano su un array di storage o l'unità di avvio del sistema operativo non è locale, questo parametro potrebbe diventare importante. Ciò comprende host con unità di boot ubicate su una SAN FC, sistemi operativi basati su NFS e unità di boot ubicate in datastore di virtualizzazione, come un file VMDK.

Se l'accesso a un'unità di boot viene interrotto da un takeover o un giveback dello storage, è possibile che la posizione binaria della griglia o l'intero sistema operativo si blocchi temporaneamente. Il tempo necessario affinché ONTAP completi l'operazione di storage e affinché il sistema operativo modifichi i percorsi e riprenda l'i/o potrebbe superare l' misscount soglia. Di conseguenza, un nodo viene eliminato immediatamente dopo il ripristino della connettività al LUN di avvio o ai binari della griglia. Nella maggior parte dei casi, l'eviction e il successivo riavvio si verificano senza messaggi di registrazione per indicare il motivo del riavvio. Non tutte le configurazioni sono interessate dal problema, pertanto è possibile testare host basati su boot SAN, NFS o datastore in un ambiente RAC in modo che RAC rimanga stabile in caso di interruzione della comunicazione con il disco di avvio.

Nel caso di unità di avvio non locali o di un hosting di file system non locale grid binari, il misscount deve essere modificato per corrispondere disktimeout. Se questo parametro viene modificato, eseguire ulteriori test per identificare anche eventuali effetti sul comportamento RAC, come il tempo di failover dei nodi.

Suggerimento

NetApp consiglia quanto segue:

  • Lasciare la misscount parametro al valore predefinito di 30 a meno che non si verifichi una delle seguenti condizioni:

    • grid i file binari si trovano su un'unità collegata alla rete, tra cui unità iSCSI, FC e basate su datastore.

    • Il sistema operativo viene avviato SAN.

  • In questi casi, valutare l'effetto delle interruzioni di rete che influiscono sull'accesso al sistema operativo o. GRID_HOME file system. In alcuni casi, tali interruzioni causano lo stallo dei daemon Oracle RAC, che può portare a un misscount`timeout e sfratto basati su -. Il valore predefinito del timeout è 27 secondi, ovvero il valore di `misscount meno reboottime. In questi casi, aumentare misscount a 200 per la corrispondenza disktimeout.

Nota
  • Il design ottimizzato per SAN di ASA r2 riduce la latenza del failover, ma i timeout devono comunque essere regolati per l'avvio in rete o per i binari della griglia.

  • Per configurazioni RAC estese o attive-attive (ad esempio, SnapMirror ActiveSync), la regolazione del timeout rimane essenziale per le architetture zero-RPO.