Monitorare i cluster con il Servizio salute
Si applica a: Locale di Azure 2311.2 e versioni successive; Windows Server 2022, Windows Server 2019, Windows Server 2016
Il Servizio sanitario, rilasciato per la prima volta in Windows Server 2016, migliora il monitoraggio e l'esperienza operativa quotidiana per i cluster che eseguono Storage Spaces Direct.
Prerequisiti
Il Servizio sanitario è abilitato per impostazione predefinita con Storage Spaces Direct. Non è necessario alcuna azione aggiuntiva per configurarlo o avviarlo. Per ulteriori informazioni su Spazi di archiviazione diretta, vedere la panoramica di Spazi di archiviazione diretta.
Cronologia delle prestazioni del cluster
Ottenere informazioni sulle prestazioni e sulla capacità in tempo reale dal cluster Spazi di archiviazione diretta. Consulta la cronologia delle prestazioni del cluster.
Errori dei servizi sanitari
Visualizzare eventuali problemi correnti per verificare facilmente lo stato del sistema di distribuzione. Vedi Visualizza i guasti del Servizio Sanitario.
azioni del Servizio Sanitario
Tenere traccia dei progressi delle azioni del Servizio sanitario eseguite in modo autonomo. Vedere Tracciare le azioni del Servizio sanitario.
Automazione
La seguente sezione descrive i flussi di lavoro automatizzati dal Servizio sanitario durante il ciclo di vita del disco.
Ciclo di vita del disco
Il servizio sanitario automatizza la maggior parte delle fasi del ciclo di vita del disco fisico. Si supponga che lo stato iniziale della distribuzione sia in stato perfetto, ovvero che tutti i dischi fisici funzionino correttamente.
Ritiro
I dischi fisici vengono disconnessi automaticamente quando non possono più essere usati e viene generato un errore corrispondente. Esistono diversi casi:
- Errore del supporto: il disco fisico è definitivamente guasto o rotto e deve essere sostituito.
- Perdita di comunicazione: il disco fisico ha perso la connettività per oltre 15 minuti consecutivi.
- Mancata risposta: è stata rilevata una latenza per il disco fisico di oltre 5,0 secondi tre o più volte all'interno di un'ora.
Nota
Se si perde la connettività di diversi dischi fisici in una sola volta, o di un intero nodo o alloggiamento di archiviazione, Servizio integrità non disconnette tali dischi poiché è improbabile che costituiscano la causa radice del problema.
Se il disco disconnesso fungeva da cache per molti altri dischi fisici, questi verranno automaticamente riassegnati a un altro disco cache disponibile. Non è richiesta alcuna azione specifica da parte dell'utente.
Ripristino della resilienza
Una volta che un disco fisico è stato disattivato, il Servizio Integrità inizia immediatamente a copiarne i dati sui dischi fisici rimanenti, per ripristinare la resilienza completa. Una volta completata questa operazione, i dati sono totalmente protetti e a tolleranza d'errore di nuovo.
Nota
Il ripristino immediato richiede una capacità sufficiente disponibile tra i dischi fisici rimanenti.
Lampeggiamento della spia
Se possibile, il Servizio Sanitario inizierà a far lampeggiare la luce dell'indicatore sul disco fisico ritirato o sullo slot corrispondente. Questo continuerà indefinitamente, finché il disco ritirato non sarà sostituito.
Nota
In alcuni casi il guasto del disco potrebbe precludere persino il lampeggiamento della spia, ad esempio in caso di mancanza totale di alimentazione elettrica.
Sostituzione fisica
È necessario sostituire il disco fisico ritirato quando possibile. La maggior parte delle volte consiste in uno scambio a caldo, ovvero non è necessario spegnere il nodo o l'enclosure di archiviazione. Consulta il guasto per ottenere utili informazioni sulla posizione e sui componenti.
Verifica
Quando il disco sostitutivo viene inserito, verrà verificato in base al documento Componenti supportati (vedere la sezione successiva).
Aggregazione
Se autorizzato, il disco sostitutivo verrà sostituito automaticamente nel pool del disco precedente per iniziare a essere usato. A questo punto, il sistema è tornato allo stato iniziale di integrità perfetta e quindi l'errore scompare.
Documento dei componenti supportati
Il Servizio sanitario fornisce un meccanismo di imposizione per limitare i componenti usati da Storage Spaces Direct a quelli presenti in un documento dei componenti supportati fornito dall'amministratore o dal fornitore di soluzioni. In questo modo si evita che l’utente usi hardware non supportato e che insorgano problemi di garanzia o di conformità con il contratto di assistenza. Questa funzionalità è attualmente limitata ai dispositivi disco fisico, incluse unità SSD, UNITÀ HDD e unità NVMe. Il documento Componenti supportati può limitare il modello, il produttore (facoltativo) e la versione del firmware (facoltativo).
Utilizzo
Il documento Componenti supportati usa una sintassi ispirata a XML. È consigliabile usare l'editor di testo preferito, ad esempio Visual Studio Code gratuito o Blocco note, per creare un documento XML che è possibile salvare e riutilizzare.
Sezioni
Il documento include due sezioni indipendenti: Disks
e Cache
.
Se la sezione Disks
viene specificata, solo le unità elencate (come Disk
) sono autorizzate ad aggiungersi ai pool. Le unità non elencate vengono impedite di unirsi ai pool, precludendo effettivamente il loro uso nell'ambiente di produzione. Se questa sezione viene lasciata vuota, qualsiasi unità potrà partecipare ai pool.
Se viene specificata la Cache
sezione , vengono usate solo le unità elencate (come CacheDisk
) per la memorizzazione nella cache. Se questa sezione viene lasciata vuota, Spazi di Archiviazione Diretta cercherà di determinare il tipo di supporto e il tipo di bus. Le unità elencate di seguito devono essere elencate anche in Disks
.
Importante
Il documento sui Componenti supportati non si applica retroattivamente alle unità che sono già state inserite in un pool e sono in uso.
Esempio
<Components>
<Disks>
<Disk>
<Manufacturer>Contoso</Manufacturer>
<Model>XYZ9000</Model>
<AllowedFirmware>
<Version>2.0</Version>
<Version>2.1</Version>
<Version>2.2</Version>
</AllowedFirmware>
<TargetFirmware>
<Version>2.1</Version>
<BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
</TargetFirmware>
</Disk>
<Disk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</Disk>
</Disks>
<Cache>
<CacheDisk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</CacheDisk>
</Cache>
</Components>
Per elencare più unità, è sufficiente aggiungere ulteriori tag <Disk>
o <CacheDisk>
.
Per inserire il codice XML durante la distribuzione di Spazi di archiviazione diretta, usare il -XML
parametro :
$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML
Per impostare o modificare il documento Componenti supportati una volta che Storage Spaces Direct è stato distribuito:
$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML
Nota
Il modello, il produttore e le proprietà della versione del firmware devono corrispondere esattamente ai valori che si ottengano usando il cmdlet Get-PhysicalDisk. Il risultato può essere diverso da quanto ci si aspetterebbe ma dipende dall’implementazione del proprio fornitore. Ad esempio, il produttore potrebbe essere "CONTOSO LTD" invece di "Contoso", oppure il campo potrebbe essere vuoto mentre il modello è "Contoso-XZY9000".
Per verificare, usare il cmdlet PowerShell seguente:
Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion
impostazioni del Servizio sanitario
Modificare le impostazioni del Servizio sanitario per regolare l'aggressività dei guasti o delle azioni, attivare o disattivare determinati comportamenti e altro ancora. Vedere Modificare le impostazioni del Servizi di Salute.