Skip to main content
Enterprise applications
O português é fornecido por meio de tradução automática para sua conveniência. O inglês precede o português em caso de inconsistências.

Tempos limite do RAC

Colaboradores jfsinmsp

O Oracle RAC é um produto exclusivo com vários tipos de processos internos de heartbeat que monitoram a integridade do cluster.

Observação As informações na "número de identificação" seção incluem informações críticas para ambientes Oracle RAC que usam armazenamento em rede e, em muitos casos, as configurações padrão do Oracle RAC precisarão ser alteradas para garantir que o cluster RAC sobreviva às alterações do caminho da rede e às operações de failover/switchover de armazenamento.

disktimeout

O parâmetro RAC principal relacionado ao armazenamento é disktimeout. Este parâmetro controla o limite dentro do qual a e/S do arquivo de votação deve ser concluída. Se o disktimeout parâmetro for excedido, o nó RAC será despejado do cluster. O padrão para este parâmetro é 200. Este valor deve ser suficiente para os procedimentos normais de aquisição de armazenamento e de giveback.

A NetApp recomenda fortemente testar cuidadosamente as configurações do RAC antes de colocá-las em produção, pois muitos fatores afetam uma aquisição ou a giveback. Além do tempo necessário para a conclusão do failover de armazenamento, também é necessário tempo adicional para que as alterações do protocolo de controle de agregação de link (LACP) se propaguem. Além disso, o software de multipathing SAN deve detetar um tempo limite de e/S e tentar novamente em um caminho alternativo. Se um banco de dados estiver extremamente ativo, uma grande quantidade de e/S deve ser enfileirada e tentada novamente antes de o disco de votação ser processado.

Se não for possível executar uma aquisição de armazenamento real ou giveback, o efeito poderá ser simulado com testes de pull de cabo no servidor de banco de dados.

Dica

A NetApp recomenda o seguinte:

  • Deixando o disktimeout parâmetro no valor padrão de 200.

  • Sempre teste uma configuração RAC completamente.

número de identificação

O misscount parâmetro normalmente afeta apenas o batimento cardíaco da rede entre nós RAC. O padrão é 30 segundos. Se os binários de grade estiverem em um storage array ou a unidade de inicialização do sistema operacional não for local, esse parâmetro pode se tornar importante. Isso inclui hosts com unidades de inicialização localizadas em uma SAN FC, sistemas operacionais iniciados por NFS e unidades de inicialização localizados em datastores de virtualização, como um arquivo VMDK.

Se o acesso a uma unidade de inicialização for interrompido por uma aquisição de armazenamento ou giveback, é possível que a localização binária da grade ou todo o sistema operacional fique temporariamente suspenso. O tempo necessário para o ONTAP concluir a operação de storage e para o sistema operacional alterar caminhos e retomar e/S pode exceder o misscount limite. Como resultado, um nó é despejado imediatamente após a conetividade com o LUN de inicialização ou binários de grade ser restaurada. Na maioria dos casos, o despejo e a reinicialização subsequente ocorrem sem mensagens de Registro para indicar o motivo da reinicialização. Nem todas as configurações são afetadas, portanto, teste qualquer host baseado em SAN-boot, NFS-boot ou datastore em um ambiente RAC para que o RAC permaneça estável se a comunicação com a unidade de inicialização for interrompida.

No caso de unidades de inicialização não locais ou binários de hospedagem de sistemas de arquivos não locais grid, o misscount precisará ser alterado para corresponder `disktimeout`ao . Se esse parâmetro for alterado, realize testes adicionais para identificar também quaisquer efeitos no comportamento do RAC, como o tempo de failover do nó.

Dica

A NetApp recomenda o seguinte:

  • Deixe o misscount parâmetro no valor padrão de 30, a menos que uma das seguintes condições se aplique:

    • grid Os binários estão localizados em uma unidade conetada à rede, incluindo unidades baseadas em NFS, iSCSI, FC e datastore.

    • O sistema operacional é inicializado pela SAN.

  • Nesses casos, avalie o efeito das interrupções da rede que afetam o acesso ao sistema operacional ou GRID_HOME aos sistemas de arquivos. Em alguns casos, tais interrupções fazem com que os daemons do Oracle RAC parem, o que pode levar a um misscount tempo limite e despejo baseado em -. O tempo limite padrão é 27 segundos, que é o valor de misscount menos reboottime. Nesses casos, aumente misscount para 200 para corresponder disktimeout.