Monitorare i cluster con il Servizio integrità
Si applica a: Locale di Azure, versioni 23H2 e 22H2; Windows Server 2022, Windows Server 2019, Windows Server 2016
La Servizio integrità, rilasciata per la prima volta in Windows Server 2016, migliora il monitoraggio e l'esperienza operativa quotidiana per i cluster che eseguono Spazi di archiviazione diretta.
Prerequisiti
Servizio integrità è abilitato per impostazione predefinita con Spazi di archiviazione diretta. Non è necessario alcuna azione aggiuntiva per configurarlo o avviarlo. Per altre informazioni sulle Spazi di archiviazione diretta, vedere la panoramica Spazi di archiviazione diretta.
Cronologia delle prestazioni del cluster
Ottenere informazioni sulle prestazioni e sulla capacità in tempo reale dal cluster Spazi di archiviazione diretta. Vedere Ottenere la cronologia delle prestazioni del cluster.
Errori servizio integrità
Visualizzare eventuali errori correnti per verificare facilmente l'integrità della distribuzione. Vedere Visualizzare gli errori di Servizio integrità.
azioni Servizio integrità
Tenere traccia dello stato di avanzamento delle azioni Servizio integrità eseguite in modo autonomo. Vedere Tenere traccia delle azioni Servizio integrità.
Automation
La sezione seguente descrive i flussi di lavoro che vengono automatizzati da Servizio integrità nel ciclo di vita del disco.
Ciclo di vita del disco
Servizio integrità consente di automatizzare la maggior parte delle fasi del ciclo di vita del disco fisico. Si supponga che lo stato iniziale della distribuzione sia in stato perfetto, ovvero che tutti i dischi fisici funzionino correttamente.
Ritiro
I dischi fisici vengono disconnessi automaticamente quando non possono più essere usati e viene generato un errore corrispondente. Esistono diversi casi:
- Errore dei supporti: il disco fisico è definitivamente guasto e non può più essere sostituito.
- Perdita di comunicazione: il disco fisico ha perso la connettività per oltre 15 minuti consecutivi.
- Mancata risposta: è stata rilevata una latenza per il disco fisico di oltre 5,0 secondi tre o più volte all'interno di un'ora.
Nota
Se si perde la connettività di diversi dischi fisici in una sola volta, o di un intero nodo o alloggiamento di archiviazione, Servizio integrità non disconnette tali dischi poiché è improbabile che costituiscano la causa radice del problema.
Se il disco disconnesso fungeva da cache per molti altri dischi fisici, questi verranno automaticamente riassegnati a un altro disco cache disponibile. Non è richiesta alcuna azione specifica da parte dell'utente.
Ripristino della resilienza
Una volta che un disco fisico è stato disattivato, Servizio integrità inizia immediatamente a copiarne i dati nei dischi fisici rimanenti, per ripristinare la resilienza completa. Una volta completata questa operazione, i dati sono totalmente protetti e a tolleranza d’errore.
Nota
Il ripristino immediato richiede una capacità sufficiente disponibile tra i dischi fisici rimanenti.
Lampeggiamento della spia
Se possibile, Servizio integrità inizierà a far lampeggiare la luce della spia del disco fisico disconnesso o dello slot corrispondente. La spia continuerà a lampeggiare per un tempo indefinito, finché il disco non verrà sostituito.
Nota
In alcuni casi il guasto del disco potrebbe precludere persino il lampeggiamento della spia, ad esempio in caso di mancanza totale di alimentazione elettrica.
Sostituzione disco fisico
È necessario sostituire il disco fisico disconnesso quando possibile. La maggior parte delle volte è costituita da uno scambio frequente, ovvero l'accensione del nodo o dell'enclosure di archiviazione non è necessaria. Vedere i dettagli dell'errore per le informazioni sulla posizione e sulla parte.
Verifica
Quando il disco sostitutivo viene inserito, verrà verificato in base al documento Componenti supportati (vedere la sezione successiva).
Pooling
Se autorizzato, il disco sostitutivo verrà sostituito automaticamente nel pool del disco precedente per iniziare a essere usato. A questo punto, il sistema è tornato allo stato iniziale di integrità perfetta e quindi l'errore scompare.
Documento componenti supportati
Il Servizio integrità fornisce un meccanismo di imposizione per limitare i componenti usati da Spazi di archiviazione diretta a quelli in un documento componenti supportati fornito dall'amministratore o dal fornitore di soluzioni. In questo modo si evita che l’utente usi hardware non supportato e che insorgano problemi di garanzia o di conformità con il contratto di assistenza. Questa funzionalità è attualmente limitata ai dispositivi disco fisico, incluse unità SSD, UNITÀ HDD e unità NVMe. Il documento Componenti supportati può limitare il modello, il produttore (facoltativo) e la versione del firmware (facoltativo).
Utilizzo
Il documento Componenti supportati usa una sintassi ispirata a XML. È consigliabile usare l'editor di testo preferito, ad esempio Visual Studio Code gratuito o Blocco note, per creare un documento XML che è possibile salvare e riutilizzare.
Sezioni
Il documento include due sezioni indipendenti: Disks
e Cache
.
Se viene specificata la Disks
sezione , solo le unità elencate (come Disk
) sono autorizzate a unire i pool. Le unità non elencate non vengono impedite di unire i pool, impedendo in modo efficace il loro uso nell'ambiente di produzione. Se questa sezione viene lasciata vuota, qualsiasi unità potrà partecipare ai pool.
Se viene specificata la Cache
sezione , vengono usate solo le unità elencate (come CacheDisk
) per la memorizzazione nella cache. Se questa sezione viene lasciata vuota, Spazi di archiviazione diretta tenta di indovinare in base al tipo di supporto e al tipo di bus. Le unità elencate di seguito devono essere elencate anche in Disks
.
Importante
Il documento Componenti supportati non si applica retroattivamente alle unità già in pool e in uso.
Esempio
<Components>
<Disks>
<Disk>
<Manufacturer>Contoso</Manufacturer>
<Model>XYZ9000</Model>
<AllowedFirmware>
<Version>2.0</Version>
<Version>2.1</Version>
<Version>2.2</Version>
</AllowedFirmware>
<TargetFirmware>
<Version>2.1</Version>
<BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
</TargetFirmware>
</Disk>
<Disk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</Disk>
</Disks>
<Cache>
<CacheDisk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</CacheDisk>
</Cache>
</Components>
Per elencare più unità, è sufficiente aggiungere altri <Disk>
tag o <CacheDisk>
.
Per inserire il codice XML durante la distribuzione di Spazi di archiviazione diretta, usare il -XML
parametro :
$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML
Per impostare o modificare il documento Componenti supportati dopo la distribuzione Spazi di archiviazione diretta:
$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML
Nota
Il modello, il produttore e le proprietà della versione del firmware devono corrispondere esattamente ai valori che si ottengano usando il cmdlet Get-PhysicalDisk. Il risultato può essere diverso da quanto ci si aspetterebbe ma dipende dall’implementazione del proprio fornitore. Ad esempio, il produttore potrebbe essere "CONTOSO LTD" invece di "Contoso", oppure il campo potrebbe essere vuoto mentre il modello è "Contoso-XZY9000".
Per verificare, usare il cmdlet PowerShell seguente:
Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion
impostazioni di Servizio integrità
Modificare Servizio integrità impostazioni per ottimizzare l'aggressività di errori o azioni, attivare o disattivare determinati comportamenti e altro ancora. Vedere Modificare le impostazioni di Servizio integrità.