Condividi tramite


Monitorare i cluster con il Servizio salute

Si applica a: Locale di Azure 2311.2 e versioni successive; Windows Server 2022, Windows Server 2019, Windows Server 2016

Il Servizio sanitario, rilasciato per la prima volta in Windows Server 2016, migliora il monitoraggio e l'esperienza operativa quotidiana per i cluster che eseguono Storage Spaces Direct.

Prerequisiti

Il Servizio sanitario è abilitato per impostazione predefinita con Storage Spaces Direct. Non è necessario alcuna azione aggiuntiva per configurarlo o avviarlo. Per ulteriori informazioni su Spazi di archiviazione diretta, vedere la panoramica di Spazi di archiviazione diretta.

Cronologia delle prestazioni del cluster

Ottenere informazioni sulle prestazioni e sulla capacità in tempo reale dal cluster Spazi di archiviazione diretta. Consulta la cronologia delle prestazioni del cluster.

Errori dei servizi sanitari

Visualizzare eventuali problemi correnti per verificare facilmente lo stato del sistema di distribuzione. Vedi Visualizza i guasti del Servizio Sanitario.

azioni del Servizio Sanitario

Tenere traccia dei progressi delle azioni del Servizio sanitario eseguite in modo autonomo. Vedere Tracciare le azioni del Servizio sanitario.

Automazione

La seguente sezione descrive i flussi di lavoro automatizzati dal Servizio sanitario durante il ciclo di vita del disco.

Ciclo di vita del disco

Il servizio sanitario automatizza la maggior parte delle fasi del ciclo di vita del disco fisico. Si supponga che lo stato iniziale della distribuzione sia in stato perfetto, ovvero che tutti i dischi fisici funzionino correttamente.

Ritiro

I dischi fisici vengono disconnessi automaticamente quando non possono più essere usati e viene generato un errore corrispondente. Esistono diversi casi:

  • Errore del supporto: il disco fisico è definitivamente guasto o rotto e deve essere sostituito.
  • Perdita di comunicazione: il disco fisico ha perso la connettività per oltre 15 minuti consecutivi.
  • Mancata risposta: è stata rilevata una latenza per il disco fisico di oltre 5,0 secondi tre o più volte all'interno di un'ora.

Nota

Se si perde la connettività di diversi dischi fisici in una sola volta, o di un intero nodo o alloggiamento di archiviazione, Servizio integrità non disconnette tali dischi poiché è improbabile che costituiscano la causa radice del problema.

Se il disco disconnesso fungeva da cache per molti altri dischi fisici, questi verranno automaticamente riassegnati a un altro disco cache disponibile. Non è richiesta alcuna azione specifica da parte dell'utente.

Ripristino della resilienza

Una volta che un disco fisico è stato disattivato, il Servizio Integrità inizia immediatamente a copiarne i dati sui dischi fisici rimanenti, per ripristinare la resilienza completa. Una volta completata questa operazione, i dati sono totalmente protetti e a tolleranza d'errore di nuovo.

Nota

Il ripristino immediato richiede una capacità sufficiente disponibile tra i dischi fisici rimanenti.

Lampeggiamento della spia

Se possibile, il Servizio Sanitario inizierà a far lampeggiare la luce dell'indicatore sul disco fisico ritirato o sullo slot corrispondente. Questo continuerà indefinitamente, finché il disco ritirato non sarà sostituito.

Nota

In alcuni casi il guasto del disco potrebbe precludere persino il lampeggiamento della spia, ad esempio in caso di mancanza totale di alimentazione elettrica.

Sostituzione fisica

È necessario sostituire il disco fisico ritirato quando possibile. La maggior parte delle volte consiste in uno scambio a caldo, ovvero non è necessario spegnere il nodo o l'enclosure di archiviazione. Consulta il guasto per ottenere utili informazioni sulla posizione e sui componenti.

Verifica

Quando il disco sostitutivo viene inserito, verrà verificato in base al documento Componenti supportati (vedere la sezione successiva).

Aggregazione

Se autorizzato, il disco sostitutivo verrà sostituito automaticamente nel pool del disco precedente per iniziare a essere usato. A questo punto, il sistema è tornato allo stato iniziale di integrità perfetta e quindi l'errore scompare.

Documento dei componenti supportati

Il Servizio sanitario fornisce un meccanismo di imposizione per limitare i componenti usati da Storage Spaces Direct a quelli presenti in un documento dei componenti supportati fornito dall'amministratore o dal fornitore di soluzioni. In questo modo si evita che l’utente usi hardware non supportato e che insorgano problemi di garanzia o di conformità con il contratto di assistenza. Questa funzionalità è attualmente limitata ai dispositivi disco fisico, incluse unità SSD, UNITÀ HDD e unità NVMe. Il documento Componenti supportati può limitare il modello, il produttore (facoltativo) e la versione del firmware (facoltativo).

Utilizzo

Il documento Componenti supportati usa una sintassi ispirata a XML. È consigliabile usare l'editor di testo preferito, ad esempio Visual Studio Code gratuito o Blocco note, per creare un documento XML che è possibile salvare e riutilizzare.

Sezioni

Il documento include due sezioni indipendenti: Disks e Cache.

Se la sezione Disks viene specificata, solo le unità elencate (come Disk) sono autorizzate ad aggiungersi ai pool. Le unità non elencate vengono impedite di unirsi ai pool, precludendo effettivamente il loro uso nell'ambiente di produzione. Se questa sezione viene lasciata vuota, qualsiasi unità potrà partecipare ai pool.

Se viene specificata la Cache sezione , vengono usate solo le unità elencate (come CacheDisk) per la memorizzazione nella cache. Se questa sezione viene lasciata vuota, Spazi di Archiviazione Diretta cercherà di determinare il tipo di supporto e il tipo di bus. Le unità elencate di seguito devono essere elencate anche in Disks.

Importante

Il documento sui Componenti supportati non si applica retroattivamente alle unità che sono già state inserite in un pool e sono in uso.

Esempio

<Components>

  <Disks>
    <Disk>
      <Manufacturer>Contoso</Manufacturer>
      <Model>XYZ9000</Model>
      <AllowedFirmware>
        <Version>2.0</Version>
        <Version>2.1</Version>
        <Version>2.2</Version>
      </AllowedFirmware>
      <TargetFirmware>
        <Version>2.1</Version>
        <BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
      </TargetFirmware>
    </Disk>
    <Disk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </Disk>
  </Disks>

  <Cache>
    <CacheDisk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </CacheDisk>
  </Cache>

</Components>

Per elencare più unità, è sufficiente aggiungere ulteriori tag <Disk> o <CacheDisk>.

Per inserire il codice XML durante la distribuzione di Spazi di archiviazione diretta, usare il -XML parametro :

$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML

Per impostare o modificare il documento Componenti supportati una volta che Storage Spaces Direct è stato distribuito:

$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML

Nota

Il modello, il produttore e le proprietà della versione del firmware devono corrispondere esattamente ai valori che si ottengano usando il cmdlet Get-PhysicalDisk. Il risultato può essere diverso da quanto ci si aspetterebbe ma dipende dall’implementazione del proprio fornitore. Ad esempio, il produttore potrebbe essere "CONTOSO LTD" invece di "Contoso", oppure il campo potrebbe essere vuoto mentre il modello è "Contoso-XZY9000".

Per verificare, usare il cmdlet PowerShell seguente:

Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion

impostazioni del Servizio sanitario

Modificare le impostazioni del Servizio sanitario per regolare l'aggressività dei guasti o delle azioni, attivare o disattivare determinati comportamenti e altro ancora. Vedere Modificare le impostazioni del Servizi di Salute.

Riferimenti aggiuntivi