Compartilhar via


Monitorar clusters com o Serviço de Integridade

Aplica-se a: Azure Local, versões 23H2 e 22H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

O Serviço de Integridade, lançado pela primeira vez no Windows Server 2016, melhora o monitoramento diário e a experiência operacional para clusters que executam Espaços de Armazenamento Diretos.

Pré-requisitos

O Serviço de Integridade é habilitado por padrão com Espaços de Armazenamento Direto. Nenhuma ação adicional é necessária para configurá-lo ou iniciá-lo. Para saber mais sobre Espaços de Armazenamento Diretos, consulte a visão geral dos Espaços de Armazenamento Diretos.

Histórico de desempenho do cluster

Obtenha informações de desempenho e capacidade em tempo real do cluster de Espaços de Armazenamento Diretos. Consulte Obter histórico de desempenho do cluster.

Falhas do Serviço de Integridade

Exiba todas as falhas atuais para verificar facilmente a integridade da sua implantação. Consulte Exibir falhas do Serviço de Integridade.

Ações do Serviço de Saúde

Acompanhe o andamento das ações do Serviço de Integridade que são executadas de forma autônoma. Consulte Acompanhar ações do Serviço de Integridade.

Automação

Esta seção descreve os fluxos de trabalho que são automatizados pelo Serviço de Integridade no ciclo de vida do disco.

Ciclo de vida do disco

O Serviço de Integridade automatiza a maioria dos estágios do ciclo de vida do disco físico. Digamos que o estado inicial de sua implantação esteja com integridade perfeita, ou seja, todos os discos físicos estão funcionando corretamente.

Desativação

Os discos físicos são desativados automaticamente quando não podem ser usados e uma falha correspondente é gerada. Há vários casos:

  • Falha de mídia: o disco físico está definitivamente com falha ou danificado e deve ser substituído.
  • Perda de comunicação: o disco físico perdeu a conectividade por mais de 15 minutos consecutivos.
  • Sem resposta: o disco físico apresentou latência de mais de 5,0 segundos três ou mais vezes em uma hora.

Observação

Se a conectividade for perdida em muitos discos físicos ao mesmo tempo ou para um nó ou compartimento de armazenamento inteiro, o Serviço de Integridade não desativará esses discos, pois eles podem não ser a causa-raiz do problema.

Se o disco desativado atuava como o cache de muitos outros discos físicos, eles serão automaticamente reatribuídos para outro disco de cache, caso disponível. Nenhuma ação especial do usuário é necessária.

Restauração de resiliência

Depois que um disco físico é desativado, o Serviço de Integridade começa imediatamente a copiar seus dados para os discos físicos restantes, para restaurar a capacidade de recuperação completa. Quando isso é concluído, os dados estão completamente seguros e tolerantes a falhas novamente.

Observação

Essa restauração imediata requer capacidade disponível suficiente entre os discos físicos restantes.

Piscar a luz indicadora

Se possível, o Serviço de Integridade começará a piscar a luz indicadora no disco físico obsoleto ou em seu slot. Isso continuará indefinidamente, até que o disco obsoleto seja substituído.

Observação

Em alguns casos, o disco pode ter falhado de uma maneira que impeça até mesmo que seu indicador luminoso funcione (por exemplo, uma perda total de energia).

Substituição física

Você deve substituir o disco físico obsoleto quando possível. Na maioria das vezes, isso consiste em uma troca a quente, ou seja, não é necessário desligar o nó ou o gabinete de armazenamento. Veja Falha para obter informações úteis sobre locais e peças.

Verificação

Quando o disco de substituição for inserido, ele será verificado em relação ao Documento de Componentes Suportados (consulte a próxima seção).

Agrupamento

Se permitido, o disco de substituição é substituído automaticamente no pool do predecessor para que o uso seja iniciado. Nesse ponto, o sistema retorna ao estado inicial de integridade perfeita e, em seguida, a falha desaparece.

Documento de componentes suportados

O Serviço de Integridade fornece um mecanismo de imposição para restringir os componentes usados por Espaços de Armazenamento Diretos àqueles em um Documento de Componentes com Suporte fornecido pelo administrador ou fornecedor da solução. Isso pode ser usado para impedir o uso incorreto de hardware sem suporte por você ou outros usuários, o que pode ajudar na conformidade de contrato de suporte ou garantia. Atualmente, essa funcionalidade está limitada a dispositivos de disco físico, incluindo SSDs, HDDs e unidades NVMe. O documento de componentes suportados pode restringir o modelo, o fabricante (opcional) e a versão do firmware (opcional).

Uso

O documento de componentes suportados usa uma sintaxe inspirada em XML. Recomendamos usar seu editor de texto favorito, como o Visual Studio Code ou o Bloco de Notas gratuito, para criar um documento XML que você pode salvar e reutilizar.

Seções

O documento tem duas seções independentes: Disks e Cache.

Se a Disks seção for fornecida, somente as unidades listadas (como Disk) terão permissão para ingressar em pools. Todas as unidades não listadas são impedidas de ingressar em pools, o que efetivamente impede seu uso na produção. Se esta seção for deixada vazia, qualquer unidade poderá ingressar em pools.

Se a Cache seção for fornecida, somente as unidades listadas (como CacheDisk) serão usadas para armazenamento em cache. Se essa seção for deixada em branco, os Espaços de Armazenamento Diretos tentarão adivinhar com base no tipo de mídia e no tipo de barramento. As unidades listadas aqui também devem ser listadas em Disks.

Importante

O documento de componentes suportados não se aplica retroativamente a unidades já agrupadas e em uso.

Exemplo

<Components>

  <Disks>
    <Disk>
      <Manufacturer>Contoso</Manufacturer>
      <Model>XYZ9000</Model>
      <AllowedFirmware>
        <Version>2.0</Version>
        <Version>2.1</Version>
        <Version>2.2</Version>
      </AllowedFirmware>
      <TargetFirmware>
        <Version>2.1</Version>
        <BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
      </TargetFirmware>
    </Disk>
    <Disk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </Disk>
  </Disks>

  <Cache>
    <CacheDisk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </CacheDisk>
  </Cache>

</Components>

Para listar várias unidades, basta adicionar outras <Disk> tags ou <CacheDisk> .

Para injetar esse XML ao implantar Espaços de Armazenamento Diretos, use o -XML parâmetro:

$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML

Para definir ou modificar o Documento de Componentes com Suporte depois que os Espaços de Armazenamento Diretos forem implantados:

$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML

Observação

As propriedades de modelo, fabricante e versão do firmware devem corresponder exatamente aos valores que você obtém usando o cmdlet Get-PhysicalDisk. Isso pode ser diferente de sua expectativa de "senso comum", dependendo da implementação do fornecedor. Por exemplo, em vez de "Contoso", o fabricante pode ser "CONTOSO-LTD" ou pode estar em branco, enquanto o modelo é "Contoso-XZY9000".

Você pode verificar usando o seguinte cmdlet do PowerShell:

Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion

Configurações do Serviço de Integridade

Modifique as configurações do Serviço de Integridade para ajustar a agressividade de falhas ou ações, ativar ou desativar determinados comportamentos e muito mais. Consulte Modificar configurações do Serviço de Integridade.

Referências adicionais