Monitorar clusters com o Serviço de Integridade
Aplica-se a: Azure Local, versões 23H2 e 22H2; Windows Server 2022, Windows Server 2019, Windows Server 2016
O Serviço de Integridade, lançado pela primeira vez no Windows Server 2016, melhora o monitoramento diário e a experiência operacional de clusters que executam Espaços de Armazenamento Diretos.
Pré-requisitos
Por predefinição, o Serviço de Estado de Funcionamento é ativado com Espaços de Armazenamento Direto. Não é necessária qualquer ação adicional para o configurar ou iniciar. Para saber mais sobre os Espaços de Armazenamento Diretos, consulte a Visão geral dos Espaços de Armazenamento Diretos.
Histórico de desempenho do cluster
Obtenha informações de desempenho e capacidade ao vivo do cluster do Storage Spaces Direct. Consulte Obter histórico de desempenho do cluster.
Falhas do Serviço de Saúde
Exiba todas as falhas atuais para verificar facilmente a integridade da sua implantação. Consulte Exibir falhas do Serviço de Integridade.
Ações dos Serviços de Saúde
Acompanhe o progresso das ações do Serviço de Saúde que são executadas de forma autônoma. Consulte Rastrear ações do Serviço de Saúde.
Automatização
Esta secção descreve os fluxos de trabalho que são automatizados pelo Serviço de Estado de Funcionamento no ciclo de vida do disco.
Ciclo de vida do disco
O Serviço de Estado de Funcionamento automatiza a maioria das fases do ciclo de vida do disco físico. Digamos que o estado inicial da sua implementação está num estado de funcionamento perfeito, isto é, todos os discos físicos estão a funcionar corretamente.
Descontinuação
Os discos físicos são automaticamente extinguidos quando já não podem ser mais utilizados e é acionado uma Falha correspondente. Existem vários casos:
- Falha de Suporte de Dados: o disco físico está definitivamente com falha ou danificado e deve ser substituído.
- Comunicação Perdida: o disco físico perdeu a conectividade durante mais de 15 minutos consecutivos.
- Não responsivo: o disco físico apresentou uma latência de mais de 5,0 segundos, três ou mais vezes dentro de uma hora.
Nota
Se perder a conectividade em muitos discos físicos ao mesmo tempo ou num nó ou bastidor armazenamento inteiro, o Serviço de Estado de Funcionamento não extinguirá estes discos, uma vez que é pouco provável que sejam o problema principal.
Se o disco extinto estava a funcionar como a cache para muitos outros discos físicos, este será automaticamente reatribuído para outro disco em cache, se estiver disponível. Não é necessária qualquer ação especial do utilizador.
Restaurar a resiliência
Depois de um disco físico ter sido extinguido, o Serviço de Estado de Funcionamento começa imediatamente a copiar os dados para os restantes discos físicos, para restaurar a resiliência completa. Quando esta ação tiver sido concluída, os dados ficam novamente em completa segurança e com tolerância a falhas.
Nota
Este restauro imediato requer a capacidade disponível suficiente entre os discos físicos restantes.
Intermitência da luz indicadora
Se possível, o Serviço de Estado de Funcionamento deixará a luz indicadora intermitente no disco físico extinto ou na respetiva ranhura. A luz indicadora ficará intermitente indefinidamente, até que o disco extinto seja substituído.
Nota
Em alguns casos, o disco pode ter falhado de uma forma que interrompe mesmo o funcionamento do indicador, por exemplo, uma perda total de energia.
Substituição física
Deve substituir o disco físico extinto logo que possível. Na maioria das vezes, isso consiste em um hot-swap - ou seja, desligar o nó ou compartimento de armazenamento não é necessário. Veja a Falha para uma localização útil e informações de peça.
Verificação
Quando o disco de substituição é inserido, ele será verificado em relação ao documento de componentes suportados (consulte a próxima seção).
Agrupamento
Se permitido, o disco de substituição é automaticamente substituído para o agrupamento do seu antecessor para começar a utilização. Neste momento, o sistema é devolvido ao seu estado de funcionamento perfeito inicial e, em seguida, a Falha desaparece.
Documento de componentes suportados
O Serviço de Integridade fornece um mecanismo de imposição para restringir os componentes usados pelo Storage Spaces Direct àqueles em um documento de componentes suportados fornecido pelo administrador ou fornecedor da solução. Tal pode ser utilizado para impedir a utilização errada do hardware não suportado pelo utilizador ou outras pessoas, o que pode ajudar com a conformidade com a garantia ou o contrato de suporte. Esta funcionalidade está atualmente limitada a dispositivos de disco físico, incluindo SSDs, HDD e unidades NVMe. O documento de componentes suportados pode restringir o modelo, o fabricante (opcional) e a versão de firmware (opcional).
Utilização
O documento de componentes suportados usa uma sintaxe inspirada em XML. Recomendamos usar seu editor de texto favorito, como o Visual Studio Code ou o Bloco de Notas gratuitos, para criar um documento XML que você pode salvar e reutilizar.
Secções
O documento tem duas secções independentes: Disks
e Cache
.
Se a Disks
seção for fornecida, somente as unidades listadas (como Disk
) terão permissão para ingressar em pools. Quaisquer unidades não listadas são impedidas de se juntar a pools, o que efetivamente impede seu uso na produção. Se esta seção for deixada vazia, qualquer unidade poderá participar de pools.
Se a Cache
seção for fornecida, somente as unidades listadas (como CacheDisk
) serão usadas para armazenamento em cache. Se esta seção for deixada vazia, o Storage Spaces Direct tentará adivinhar com base no tipo de mídia e no tipo de barramento. As unidades listadas aqui também devem ser listadas em Disks
.
Importante
O documento de componentes suportados não se aplica retroativamente a unidades já agrupadas e em uso.
Exemplo
<Components>
<Disks>
<Disk>
<Manufacturer>Contoso</Manufacturer>
<Model>XYZ9000</Model>
<AllowedFirmware>
<Version>2.0</Version>
<Version>2.1</Version>
<Version>2.2</Version>
</AllowedFirmware>
<TargetFirmware>
<Version>2.1</Version>
<BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
</TargetFirmware>
</Disk>
<Disk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</Disk>
</Disks>
<Cache>
<CacheDisk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</CacheDisk>
</Cache>
</Components>
Para listar várias unidades, basta adicionar tags ou <Disk>
<CacheDisk>
adicionais.
Para injetar esse XML ao implantar Espaços de Armazenamento Diretos, use o -XML
parâmetro:
$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML
Para definir ou modificar o documento de componentes suportados depois que os Espaços de Armazenamento Diretos forem implantados:
$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML
Nota
O modelo, o fabricante e as propriedades da versão de firmware devem corresponder exatamente aos valores que obtém ao utilizar o cmdlet Get-PhysicalDisk. Esses valores podem diferir com base na sua expetativa de “senso comum”, dependendo da implementação do seu fornecedor. Por exemplo, ao invés de “Contoso”, o fabricante poderá ser “CONTOSO Lda.” ou pode ficar em branco enquanto o modelo é “Contoso-XZY9000”.
Pode verificar com o cmdlet PowerShell seguinte:
Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion
Configurações do Serviço de Integridade
Modifique as configurações do Serviço de Integridade para ajustar a agressividade de falhas ou ações, ativar ou desativar determinados comportamentos e muito mais. Consulte Modificar configurações do Serviço de Integridade.