Condividi tramite


Monitorare i cluster con il Servizio integrità

Si applica a: Locale di Azure, versioni 23H2 e 22H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

La Servizio integrità, rilasciata per la prima volta in Windows Server 2016, migliora il monitoraggio e l'esperienza operativa quotidiana per i cluster che eseguono Spazi di archiviazione diretta.

Prerequisiti

Servizio integrità è abilitato per impostazione predefinita con Spazi di archiviazione diretta. Non è necessario alcuna azione aggiuntiva per configurarlo o avviarlo. Per altre informazioni sulle Spazi di archiviazione diretta, vedere la panoramica Spazi di archiviazione diretta.

Cronologia delle prestazioni del cluster

Ottenere informazioni sulle prestazioni e sulla capacità in tempo reale dal cluster Spazi di archiviazione diretta. Vedere Ottenere la cronologia delle prestazioni del cluster.

Errori servizio integrità

Visualizzare eventuali errori correnti per verificare facilmente l'integrità della distribuzione. Vedere Visualizzare gli errori di Servizio integrità.

azioni Servizio integrità

Tenere traccia dello stato di avanzamento delle azioni Servizio integrità eseguite in modo autonomo. Vedere Tenere traccia delle azioni Servizio integrità.

Automation

La sezione seguente descrive i flussi di lavoro che vengono automatizzati da Servizio integrità nel ciclo di vita del disco.

Ciclo di vita del disco

Servizio integrità consente di automatizzare la maggior parte delle fasi del ciclo di vita del disco fisico. Si supponga che lo stato iniziale della distribuzione sia in stato perfetto, ovvero che tutti i dischi fisici funzionino correttamente.

Ritiro

I dischi fisici vengono disconnessi automaticamente quando non possono più essere usati e viene generato un errore corrispondente. Esistono diversi casi:

  • Errore dei supporti: il disco fisico è definitivamente guasto e non può più essere sostituito.
  • Perdita di comunicazione: il disco fisico ha perso la connettività per oltre 15 minuti consecutivi.
  • Mancata risposta: è stata rilevata una latenza per il disco fisico di oltre 5,0 secondi tre o più volte all'interno di un'ora.

Nota

Se si perde la connettività di diversi dischi fisici in una sola volta, o di un intero nodo o alloggiamento di archiviazione, Servizio integrità non disconnette tali dischi poiché è improbabile che costituiscano la causa radice del problema.

Se il disco disconnesso fungeva da cache per molti altri dischi fisici, questi verranno automaticamente riassegnati a un altro disco cache disponibile. Non è richiesta alcuna azione specifica da parte dell'utente.

Ripristino della resilienza

Una volta che un disco fisico è stato disattivato, Servizio integrità inizia immediatamente a copiarne i dati nei dischi fisici rimanenti, per ripristinare la resilienza completa. Una volta completata questa operazione, i dati sono totalmente protetti e a tolleranza d’errore.

Nota

Il ripristino immediato richiede una capacità sufficiente disponibile tra i dischi fisici rimanenti.

Lampeggiamento della spia

Se possibile, Servizio integrità inizierà a far lampeggiare la luce della spia del disco fisico disconnesso o dello slot corrispondente. La spia continuerà a lampeggiare per un tempo indefinito, finché il disco non verrà sostituito.

Nota

In alcuni casi il guasto del disco potrebbe precludere persino il lampeggiamento della spia, ad esempio in caso di mancanza totale di alimentazione elettrica.

Sostituzione disco fisico

È necessario sostituire il disco fisico disconnesso quando possibile. La maggior parte delle volte è costituita da uno scambio frequente, ovvero l'accensione del nodo o dell'enclosure di archiviazione non è necessaria. Vedere i dettagli dell'errore per le informazioni sulla posizione e sulla parte.

Verifica

Quando il disco sostitutivo viene inserito, verrà verificato in base al documento Componenti supportati (vedere la sezione successiva).

Pooling

Se autorizzato, il disco sostitutivo verrà sostituito automaticamente nel pool del disco precedente per iniziare a essere usato. A questo punto, il sistema è tornato allo stato iniziale di integrità perfetta e quindi l'errore scompare.

Documento componenti supportati

Il Servizio integrità fornisce un meccanismo di imposizione per limitare i componenti usati da Spazi di archiviazione diretta a quelli in un documento componenti supportati fornito dall'amministratore o dal fornitore di soluzioni. In questo modo si evita che l’utente usi hardware non supportato e che insorgano problemi di garanzia o di conformità con il contratto di assistenza. Questa funzionalità è attualmente limitata ai dispositivi disco fisico, incluse unità SSD, UNITÀ HDD e unità NVMe. Il documento Componenti supportati può limitare il modello, il produttore (facoltativo) e la versione del firmware (facoltativo).

Utilizzo

Il documento Componenti supportati usa una sintassi ispirata a XML. È consigliabile usare l'editor di testo preferito, ad esempio Visual Studio Code gratuito o Blocco note, per creare un documento XML che è possibile salvare e riutilizzare.

Sezioni

Il documento include due sezioni indipendenti: Disks e Cache.

Se viene specificata la Disks sezione , solo le unità elencate (come Disk) sono autorizzate a unire i pool. Le unità non elencate non vengono impedite di unire i pool, impedendo in modo efficace il loro uso nell'ambiente di produzione. Se questa sezione viene lasciata vuota, qualsiasi unità potrà partecipare ai pool.

Se viene specificata la Cache sezione , vengono usate solo le unità elencate (come CacheDisk) per la memorizzazione nella cache. Se questa sezione viene lasciata vuota, Spazi di archiviazione diretta tenta di indovinare in base al tipo di supporto e al tipo di bus. Le unità elencate di seguito devono essere elencate anche in Disks.

Importante

Il documento Componenti supportati non si applica retroattivamente alle unità già in pool e in uso.

Esempio

<Components>

  <Disks>
    <Disk>
      <Manufacturer>Contoso</Manufacturer>
      <Model>XYZ9000</Model>
      <AllowedFirmware>
        <Version>2.0</Version>
        <Version>2.1</Version>
        <Version>2.2</Version>
      </AllowedFirmware>
      <TargetFirmware>
        <Version>2.1</Version>
        <BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
      </TargetFirmware>
    </Disk>
    <Disk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </Disk>
  </Disks>

  <Cache>
    <CacheDisk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </CacheDisk>
  </Cache>

</Components>

Per elencare più unità, è sufficiente aggiungere altri <Disk> tag o <CacheDisk> .

Per inserire il codice XML durante la distribuzione di Spazi di archiviazione diretta, usare il -XML parametro :

$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML

Per impostare o modificare il documento Componenti supportati dopo la distribuzione Spazi di archiviazione diretta:

$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML

Nota

Il modello, il produttore e le proprietà della versione del firmware devono corrispondere esattamente ai valori che si ottengano usando il cmdlet Get-PhysicalDisk. Il risultato può essere diverso da quanto ci si aspetterebbe ma dipende dall’implementazione del proprio fornitore. Ad esempio, il produttore potrebbe essere "CONTOSO LTD" invece di "Contoso", oppure il campo potrebbe essere vuoto mentre il modello è "Contoso-XZY9000".

Per verificare, usare il cmdlet PowerShell seguente:

Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion

impostazioni di Servizio integrità

Modificare Servizio integrità impostazioni per ottimizzare l'aggressività di errori o azioni, attivare o disattivare determinati comportamenti e altro ancora. Vedere Modificare le impostazioni di Servizio integrità.

Riferimenti aggiuntivi