Os cenários de failover de cluster em seu dispositivo de GPU do Azure Stack Edge Pro
Este artigo identifica os cenários de failover comuns, como o dispositivo de Azure Stack Edge responde e o impacto geral sobre as cargas de trabalho implantadas no cluster deve ocorrer um failover.
Sobre o failover
O Azure Stack Edge pode ser configurado como um único dispositivo autônomo ou um cluster de dois nós. Em um cluster de dois nós, os nós clusterizados fornecem alta disponibilidade para aplicativos e serviços em execução no cluster.
Se um dos nós clusterizados falhar, o outro nó começará a fornecer o serviço – esse processo é conhecido como failover. O failover também pode ocorrer se os componentes de hardware associados a um ou ambos os nós do dispositivo, como unidades de disco, PSUs (unidades de fonte de alimentação) ou falha de rede, ou quando você atualiza os nós do dispositivo.
Cenários de failover
O failover pode ocorrer como resultado de uma falha de componente de hardware, falha de nó ou ao atualizar o cluster de Azure Stack Edge.
Falhas de hardware
Essas tabelas resumem os cenários de falha para um componente de hardware físico associado ao cluster de dispositivos, como uma ou mais unidades de disco, fonte de energia ou rede.
Falha da unidade de disco
Nó A | Nó B | Sobrevives ao cluster | Failover | Detalhes |
---|---|---|---|---|
1 unidade de disco falha | Sem falhas | Sim | Não | O cluster está degradado até que o disco seja substituído. |
2 ou mais unidades de disco falharem | Sem falhas | Sim | Não | O cluster está degradado até que o disco seja substituído. |
1 ou mais unidades de disco falharem | 1 ou mais unidades de disco falharem | Não | O cluster fica offline. |
Falhas de unidade de fonte de alimentação
Nó A | Nó B | Sobrevives ao cluster | Failover | Detalhes |
---|---|---|---|---|
1 PSU falha | Sem falhas | Sim | Não | Outra falha de fonte de alimentação no nó A resultará em failover para o nó B. |
1 PSU falha | 1 PSU falha | Sim | Não | Outra falha de fonte de alimentação em ambos os nós resultará em failover. |
2 PSUs falha | Sem falhas | Sim | Yes | VMs no nó A fazem failover para o nó B. |
2 PSUs de falhas (TBC) | 1 PSU falha | Sim | Yes | VMs no nó A fazem failover para o nó B. |
2 PSUs falha | 2 PSUs falha | Não | O cluster fica offline. |
Falhas de rede
Nó A | Nó B | Sobrevives ao cluster | Failover | Detalhes |
---|---|---|---|---|
A porta 1, porta 2, porta 5 ou porta 6 falham | Sem falhas | Sim | Não | A porta com falha não está disponível. Os aplicativos que escutam nesta porta são afetados |
1 ou ambas as portas 3 e 4 falham | Sem falhas | Sim | Yes | As VMs no nó A fazem failover para o nó B |
Falhas e atualizações de nó
Falha de nó
Esta tabela resume os cenários de falha quando um nó inteiro falha no cluster.
Nó A | Nó B | Sobrevives ao cluster | Failover | Detalhes |
---|---|---|---|---|
Falha no nó inteiro | Sem falhas | Sim | Yes | As VMs do nó A fazem failover para o nó B |
Falha no nó inteiro | Falha no nó inteiro | Não | - | O cluster fica offline |
Reboot | Sem falhas | Sim | Yes | As VMs do nó A fazem failover para o nó B |
Reboot | Reboot | Não | - | O cluster fica offline até que a reinicialização seja concluída |
Falha no componente principal. Por exemplo, placa-mãe, DIMM e disco do sistema operacional. | Sem falhas | Sim | Yes | As VMs do nó A fazem failover para o nó B |
Falha no componente principal. Por exemplo, placa-mãe, DIMM e disco do sistema operacional. | Falha no componente principal. Por exemplo, placa-mãe, DIMM e disco do sistema operacional. | Não | - | O cluster fica offline |
Atualização de nó
Nó A | Nó B | Sobrevives ao cluster | Failover | Detalhes |
---|---|---|---|---|
Atualização de nó | Sem falhas | Sim | Yes | As VMs do nó A fazem failover para o nó B |
Atualização de nó | 2 PSUs falha | Não | - | O cluster fica offline |
Atualização de nó | O nó inteiro falha ou fica offline | Não | - | O cluster fica offline |
Atualização de nó | Reboot | Não | - | O cluster fica offline |
Atualização de nó | Falha no componente principal, como placa-mãe, DIMM e disco do sistema operacional. | Não | - | O cluster fica offline |
Próximas etapas
- Saiba mais sobre os tamanhos e os tipos de VM para o Azure Stack Edge Pro GPU.