Monitorare un singolo cluster Azure Stack HCI con Insights
Si applica a: Azure Stack HCI, versione 22H2
Importante
Azure Stack HCI ora fa parte di Azure Local. Tuttavia, le versioni precedenti di Azure Stack HCI, ad esempio 22H2 continueranno a fare riferimento ad Azure Stack HCI e non rifletteranno la modifica del nome. Altre informazioni.
Questo articolo illustra come usare Insights per monitorare un singolo cluster Azure Stack HCI. Per più cluster Azure Stack HCI, vedere Monitorare più cluster Azure Stack HCI con Insights.
Insights è una funzionalità di Monitoraggio di Azure che consente di iniziare rapidamente a monitorare il cluster Azure Stack HCI. È possibile visualizzare le metriche chiave, l'integrità e l'utilizzo relative a cluster, server, macchine virtuali e archiviazione.
Importante
Se hai registrato il cluster di Azure Stack HCI e configurato Insights prima di novembre 2023, alcune funzionalità che utilizzano l'Azure Monitor Agent (AMA), come Arc for Servers, VM Insights, Defender for Cloud o Sentinel, potrebbero non raccogliere correttamente i log e i dati degli eventi. Per indicazioni sulla risoluzione dei problemi, vedere la sezione Risolvere i problemi dei cluster registrati prima di novembre 2023 .
Vantaggi
Insights per Azure Stack HCI offre i vantaggi seguenti:
Gestito da Azure. Insights viene gestito da Azure ed è accessibile tramite il portale di Azure, assicurandosi che sia sempre aggiornato. Non c'è bisogno di un database o di una configurazione software speciale.
Scalabilità. Insights è in grado di caricare più di 400 set di informazioni del cluster tra più sottoscrizioni contemporaneamente. Non esistono limitazioni per il cluster, il dominio o la posizione fisica.
Personalizzabilità. L'esperienza di Insight è costruita sui modelli di cartella di lavoro di Azure Monitor. In questo modo è possibile modificare le visualizzazioni e le query, modificare o impostare soglie allineate ai limiti specifici e quindi salvare queste personalizzazioni in una cartella di lavoro. È quindi possibile aggiungere grafici nelle cartelle di lavoro ai dashboard di Azure.
Configurare Insights per Azure Stack HCI
I prerequisiti e le impostazioni per l'uso di Insights variano a seconda della versione di Azure Stack HCI disponibile. Selezionare una delle schede seguenti per istruzioni su come usare Insights nella versione specifica di Azure Stack HCI.
La funzionalità Insights in Azure Stack HCI, versioni 22H2 e successive, usa AMA, che offre vantaggi significativi rispetto alla versione legacy di Microsoft Monitoring Agent (MMA) usata in Azure Stack HCI, versione 21H2 e precedenti. Questi vantaggi includono una maggiore velocità, una maggiore sicurezza e prestazioni superiori. È possibile eseguire l'onboarding di nuovi nodi in AMA o eseguire la migrazione dei nodi esistenti dall'agente legacy ad AMA.
È consigliabile aggiornare il sistema Azure Stack HCI alla versione 22H2 o successiva per sfruttare l'esperienza Insights con AMA.
A partire dall'aggiornamento cumulativo di maggio 2023 per Azure Stack HCI versione 22H2, è possibile monitorare i sistemi Azure Stack HCI locali con Insights per Azure Stack HCI.
Prerequisiti
Ecco i prerequisiti per l'uso di Insights per Azure Stack HCI:
Il cluster Azure Stack HCI deve essere registrato con Azure e abilitato per Arc. Se hai registrato il tuo cluster il 15 giugno 2021 o dopo, questo avviene per impostazione predefinita. In caso contrario, è necessario abilitare l'integrazione di Azure Arc.
Il cluster deve avere Azure Stack HCI versione 22H2 e l'aggiornamento cumulativo di maggio 2023 o versione successiva.
L'identità gestita per la risorsa di Azure deve essere abilitata. Per altre informazioni, vedere Abilitazione della gestione avanzata.
Abilitare gli approfondimenti
L'abilitazione di Insights consente di monitorare tutti i cluster Azure Stack HCI attualmente associati all'area di lavoro Log Analytics fornendo metriche di integrità utili. Insights installa l'agente di Monitoraggio di Azure e consente di configurare le regole di raccolta dati per il monitoraggio del cluster Azure Stack HCI.
Per abilitare questa funzionalità dalla portale di Azure, seguire questa procedura:
Nel portale di Azure, passare alla pagina della risorsa cluster Azure Stack HCI, e quindi selezionare il cluster. Nella scheda Funzionalità selezionare Informazioni dettagliate.
Nella pagina Informazioni dettagliate selezionare Attività iniziali.
Nota
Il pulsante Inizia è disponibile solo per Azure Stack HCI, versione 22H2 con l'aggiornamento cumulativo di maggio 2023 o successivo installato, e solo dopo l'abilitazione dell'identità gestita. In caso contrario, questo pulsante è disabilitato.
Nella pagina di configurazione di Insights, selezionare un DCR esistente dal menu a tendina Regola di raccolta dati. DCR specifica i registri eventi e i contatori delle prestazioni che devono essere raccolti e archiviati in un'area di lavoro Log Analytics. Insights crea un record di dominio predefinito se non ne esiste già uno. Sono inclusi solo i DCR abilitati per Insights.
(Facoltativo) È anche possibile creare un nuovo DCR selezionando Crea nuovo nella pagina di configurazione di Insights.
Importante
Raccomandiamo vivamente di non creare il proprio DCR. La DCR creata da Insights include un flusso di dati speciale richiesto per il suo funzionamento. È possibile modificare questo DCR per raccogliere più dati, ad esempio eventi Di Windows e Syslog. I DCR creati tramite l'installazione AMA avranno un prefisso
AzureStackHCI-
attaccato al nome del DCR.Nella pagina Nuova regola di raccolta dati specificare la sottoscrizione, il nome DCR e il nome dell'endpoint di raccolta dati.On the New data collection rule page, specify the subscription, DCR name, and data collection endpoint (DCE) name. I DCE vengono usati per accedere al servizio di configurazione per recuperare i DCR associati per l'Azure Monitor Agent. Per ulteriori informazioni su DCE, consulta Endpoint di raccolta dati in Azure Monitor.
Nota
Se si usano collegamenti privati nell'agente, è necessario aggiungere i DCE. Per altre informazioni sulle impostazioni di rete ama, vedere Definire le impostazioni di rete dell'agente di Monitoraggio di Azure.
Selezionare il pulsante Rivedi e crea.
Se un DCR (Data Collection Rule) non è già stato creato per il cluster non monitorato, ne viene creato uno con i contatori delle prestazioni abilitati e il canale del registro eventi di Windows abilitato.
Esaminare la schermata finale con un riepilogo del nome del DCR, il numero di registri di eventi, i contatori delle prestazioni e il nome dell'area di lavoro Log Analytics in cui i dati vengono archiviati. Selezionare Configura.
Dopo aver selezionato Configura, si verrà reindirizzati alla pagina Estensioni , in cui è possibile visualizzare lo stato dell'installazione dell'agente. Configurando Insights, Ama viene installato automaticamente in tutti i nodi del cluster.
Vai alla pagina della risorsa del cluster di Azure Stack HCI e quindi seleziona il cluster. Insights ora viene visualizzato come Configurato nella scheda Funzionalità :
Regole di raccolta dati
Quando si abilita Insights in un computer con l'agente di Monitoraggio di Azure, è necessario specificare un DCR da usare. Per ulteriori informazioni sulle regole di raccolta dati, vedere Regole di raccolta dati in Monitor di Azure.
Opzione | Descrizione |
---|---|
Contatori delle prestazioni | Specifica i contatori delle prestazioni dei dati da raccogliere dal sistema operativo. Questa opzione è obbligatoria per tutti i computer. Questi contatori delle prestazioni vengono usati per popolare le visualizzazioni nella cartella di lavoro di Insights. Attualmente, la cartella di lavoro di Insights usa cinque contatori delle prestazioni : Memory()\Available Bytes , Network Interface()\Bytes Total/sec , Processor(_Total)\% Processor Time RDMA Activity()\RDMA Inbound Bytes/sec , eRDMA Activity()\RDMA Outbound Bytes/sec |
Canale del registro eventi | Specifica i registri eventi di Windows da raccogliere dal sistema operativo. Questa opzione è obbligatoria per tutti i computer. I log eventi di Windows vengono usati per popolare le visualizzazioni nella cartella di lavoro di Insights. Attualmente, i dati vengono raccolti tramite due canali del registro eventi di Windows: - microsoft-windows-health/operational e microsoft-windows-sddc-management/operational |
spazio di lavoro Log Analytics | Area di lavoro per archiviare i dati. Vengono elencate solo le aree di lavoro con Informazioni dettagliate. |
Canale eventi
Il Microsoft-windows-sddc-management/operational
e Microsoft-windows-health/operational
canale eventi di Windows viene aggiunto all'area di lavoro Log Analytics sotto i registri eventi di Windows.
Raccogliendo questi log, Insights mostra lo stato di integrità dei singoli server, unità, volumi e macchine virtuali. Per impostazione predefinita, vengono aggiunti cinque contatori delle prestazioni.
Contatori delle prestazioni
Per impostazione predefinita, vengono aggiunti cinque contatori delle prestazioni:
Nella tabella seguente vengono descritti i contatori delle prestazioni monitorati:
Contatori delle prestazioni | Descrizione |
---|---|
Memoria(*)\Byte disponibili | I byte disponibili sono la quantità di memoria fisica, in byte, immediatamente disponibile per l'allocazione a un processo o per l'uso del sistema. |
Interfaccia di rete (*)\Totale byte/sec | Frequenza con cui i byte vengono inviati e ricevuti su ogni scheda di rete, inclusi i caratteri di frame. Byte Totale/sec è una somma di byte ricevuti/sec e byte inviati/sec. |
Processore(_Total)% Tempo del processore | Percentuale di tempo trascorso in cui tutti i thread di processo hanno usato il processore per le istruzioni di esecuzione. |
Attività RDMA(*)\RDMA Byte in ingresso/sec | Frequenza dei dati ricevuti tramite RDMA dalla scheda di rete al secondo. |
Attività RDMA(*)\Byte RDMA in uscita al secondo | Frequenza dei dati inviati tramite RDMA dalla scheda di rete al secondo. |
Dopo aver abilitato Insights, la raccolta dei dati può richiedere fino a 15 minuti. Al termine del processo, è possibile visualizzare una visualizzazione completa dell'integrità del cluster dal menu Insights nel riquadro sinistro:
Disabilitare Insights
Per disabilitare Insights, seguire questa procedura:
Selezionare Informazioni dettagliate nella scheda Funzionalità .
Selezionare Disabilita informazioni dettagliate.
Quando si disabilita la funzionalità Insights, l'associazione tra la regola di raccolta dati e il cluster viene eliminata e i log di gestione Servizio integrità e SDDC non vengono più raccolti, ma i dati esistenti non vengono eliminati. Per eliminare tali dati, accedere all'area di lavoro DCR e Log Analytics ed eliminare i dati manualmente.
Aggiornamento degli Approfondimenti
Il riquadro Insights mostra un messaggio Di aggiornamento necessario nei casi seguenti:
- Viene modificata una regola di raccolta dati.
- Viene eliminato un evento di stato dal registro eventi di Windows.
- Uno dei cinque contatori delle prestazioni dell'area di lavoro Log Analytics viene eliminato.
Per abilitare di nuovo Insights, seguire questa procedura:
Selezionare il riquadro Informazioni dettagliate in Funzionalità.
Selezionare Aggiorna per visualizzare di nuovo le visualizzazioni.
Eseguire la migrazione da Microsoft Monitoring Agent
Per eseguire la migrazione da Microsoft Monitoring Agent (MMA) ad Azure Monitoring Agent (AMA), scorrere verso il basso fino a Insights.
Selezionare Installa AMA. Verrà visualizzata la finestra di configurazione di Insights.
Selezionare o creare una regola di raccolta dati come descritto in precedenza nella sezione Abilitare Insights.
L'agente di Monitoraggio di Azure e l'estensione Microsoft Monitoring Agent possono essere entrambi installati nello stesso computer durante la migrazione. L'esecuzione di entrambi gli agenti può comportare la duplicazione dei dati e un aumento dei costi. Se in un computer sono installati entrambi gli agenti, viene visualizzato un avviso nella portale di Azure che è possibile raccogliere dati duplicati, come illustrato nello screenshot seguente.
Avviso
La raccolta di dati duplicati da un singolo computer con l'agente di Monitoraggio di Azure e l'estensione Microsoft Monitoring Agent può comportare costi aggiuntivi per l'inserimento dall'invio di dati duplicati all'area di lavoro Log Analytics.
È necessario rimuovere manualmente l'estensione Microsoft Monitoring Agent da tutti i computer che lo usano. Prima di eseguire questo passaggio, assicurarsi che il computer non si basi su altre soluzioni che richiedono Microsoft Monitoring Agent. Dopo aver verificato che MicrosoftMonitoringAgent non sia ancora connesso all'area di lavoro Log Analytics, è possibile rimuovere Manualmente MicrosoftMonitoringAgent reindirizzando alla pagina Estensioni .
Risoluzione dei problemi
Questa sezione fornisce indicazioni per la risoluzione dei problemi relativi all'uso di Insights per Azure Stack HCI.
Risolvere i problemi relativi ai cluster registrati prima di novembre 2023
Questione. Nei cluster registrati prima di novembre 2023, le funzionalità che usano AMA in Azure Stack HCI, ad esempio Arc per server, Informazioni dettagliate macchina virtuale, Informazioni dettagliate contenitore, Defender per il cloud e Sentinel potrebbero non raccogliere correttamente i log e i dati degli eventi.
Causa Prima di novembre 2023, la registrazione del cluster ha configurato AMA per l'uso dell'identità del cluster, mentre i servizi che usano AMA in Azure Stack HCI richiedevano l'identità del nodo del cluster per la raccolta dei log appropriata. Questa mancata corrispondenza ha causato una raccolta non corretta di log da questi servizi.
Soluzione. Per risolvere questo problema, è stata apportata una modifica alla registrazione del cluster HCI per AMA per usare invece l'identità del server. Per implementare questa modifica, seguire questa procedura nei cluster registrati prima di novembre 2023:
- Riparare la registrazione del cluster. Vedere Ripristinare la registrazione del cluster.
- Riparazione AMA. Consulta Riparazione AMA.
- Riconfigurare Insights per Azure Stack HCI. Vedere Riconfigurare Insights per Azure Stack HCI.
Nella portale di Azure la pagina Insights for Azure Stack HCI rileva automaticamente la modifica nella configurazione ama e visualizza un banner nella parte superiore della pagina, guidando l'utente a intraprendere le azioni necessarie per continuare a usare i servizi che si basano su AMA.
Riparare la registrazione del cluster
Per ripristinare la registrazione del cluster, seguire questa procedura:
Nei nodi del cluster installare il modulo PowerShell più recente
Az.StackHCI
. Sostituirelatestversion
con il numero di versione più recenteAz.StackHCI
.Install-Module -Name Az.StackHCI -RequiredVersion {latestversion} -Scope CurrentUser -Repository PSGallery -Force
Eseguire il comando di registrazione di ripristino per rimuovere la chiave regkey:
Register-AzStackHCI -TenantId {TenantID} -SubscriptionId {subscriptionID} -ComputerName {NodeName} -RepairRegistration
Riparare AMA per Azure Stack HCI
Scegliere una delle opzioni seguenti per ripristinare AMA:
Opzione 1: Disinstallare AMA
Se AMA è già aggiornato, disinstallarlo. Seguire questa procedura per disinstallare AMA:
Opzione 2: Aggiornare AMA
Seguire questa procedura per aggiornare l'ama:
Opzione 3: Riavviare AMA
Seguire questa procedura in tutti i nodi del cluster per riavviare AMA:
Eseguire il comando seguente per disabilitare AMA:
cd C:\Packages\Plugins\Microsoft.Azure.Monitor.AzureMonitorWindowsAgent\<agent version number> AzureMonitorAgentExtension.exe disable
Dopo il completamento dell'eseguibile e l'arresto di tutti i processi AMA, eseguire il comando seguente per riavviare l'agente:
AzureMonitorAgentExtension.exe enable
Opzione 4: Riavviare i nodi del cluster
Riconfigurare Approfondimenti per Azure Stack HCI
Seguire questa procedura per riconfigurare Insights per Azure Stack HCI:
Nella portale di Azure la pagina Informazioni dettagliate per il cluster Azure Stack HCI visualizza un banner nella parte superiore, come illustrato nello screenshot seguente, che consente di configurare di nuovo Insights e associare DCR ai nodi del cluster. Esaminare il banner e selezionare Configura informazioni dettagliate.
Riconfigurare DCR. Per configurare Insights, seguire le istruzioni come indicato in questo articolo. Vedi Configurare Insights per Azure Stack HCI.
Risolvere i problemi relativi alla pagina delle cartelle di lavoro vuota senza dati
Questione. Viene visualizzata una pagina Cartelle di lavoro vuota senza dati, come illustrato nello screenshot seguente.
Possibili cause. Potrebbero esserci diverse possibili cause per questo problema, tra cui la configurazione recente di Insights, i passaggi di risoluzione dei problemi incompleti per i cluster registrati prima di novembre 2023 o il record di dominio associato non è configurato correttamente.
Soluzione. Per risolvere il problema, seguire questa procedura in sequenza:
- Se insights è stato configurato di recente, attendere fino a un'ora affinché AMA raccolga i dati.
- Se non sono ancora presenti dati dopo l'attesa, assicurarsi di aver completato tutti i passaggi indicati nella sezione Risolvere i problemi dei cluster registrati prima di novembre 2023 .
- Verificare la configurazione del record di controllo di dominio associato. Assicurarsi che i canali di evento e i contatori delle prestazioni vengano aggiunti come origini dati al DCR associato, come descritto nella sezione Regole di raccolta dati.
- Se il problema persiste dopo aver eseguito i passaggi precedenti e non vengono ancora visualizzati dati, contattare il supporto tecnico per assistenza.
Per indicazioni più dettagliate sulla risoluzione dei problemi, vedere Linee guida per la risoluzione dei problemi per l'agente di Monitoraggio di Azure.
Visualizzazioni di Approfondimenti
Dopo aver abilitato Insights, le tabelle seguenti forniscono informazioni dettagliate su tutte le risorse.
Integrità
Fornisce guasti di sistema in un cluster.
Metrico | Descrizione | Unità | Esempio |
---|---|---|---|
Guasto | Breve descrizione dei problemi di salute. Facendo clic sul collegamento, viene visualizzato un pannello laterale con altre informazioni. | Nessuna unità | Soglia di capacità della piscina superata |
Tipo di risorsa difettosa | Tipo di risorsa che ha rilevato un errore. | Nessuna unità | StoragePool |
ID risorsa con errore | ID univoco per la risorsa che è incorsa in un errore di stato. | ID univoco | {a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1}: SP:{b1b1b1b1-cccc-dddd-eeee-f2f2f2f2f2f2f2f2} |
Gravità | La gravità dell'errore potrebbe essere di avvertimento o critica. | Nessuna unità | Avviso |
Tempo di errore iniziale | Timestamp dell'ultimo aggiornamento del server. | Data e ora | 4/9/2022, 12:15:42 PM |
Server
Metrico | Descrizione | Unità | Esempio |
---|---|---|---|
Server | Nomi dei server nel cluster. | Nessuna unità | VM-1 |
Ultimo aggiornamento | Data e ora dell'ultimo aggiornamento del server. | Datetime | 4/9/2022, 12:15:42 PM |
Status | Integrità delle risorse del server nel cluster. | Può essere sano, attenzione, critico e altro | Sano |
Utilizzo CPU | % del tempo in cui il processo ha usato la CPU. | Percentuale | 56% |
Utilizzo memoria | L'utilizzo della memoria del processo server è uguale al contatore Process\Private Bytes più le dimensioni dei dati mappati alla memoria. | Percentuale | 16% |
Processori logici | Numero di processori logici. | Conteggio | 2 |
le CPU | Numero di CPU. | Contare | 2 |
Tempo di attività | Il tempo durante il quale un computer, in particolare un computer, è in funzione. | TimeSpan | 2,609 ore. |
Sito | Nome del sito a cui appartiene il server. | Nome del sito | SitoA |
Nome di dominio | Dominio locale a cui appartiene il server. | Nessuna unità | Contoso.local |
Macchine virtuali
Fornisce lo stato di tutte le macchine virtuali nel cluster. Una macchina virtuale può essere in uno dei seguenti stati: In esecuzione, Arrestato, Non riuscito o Altro (Sconosciuto, Avvio, Acquisizione snapshot, Salvataggio, Arresto, Sospensione, Ripresa, Sospeso, Sospensione completa).
Misura | Descrizione | Unità | Esempio |
---|---|---|---|
Server | Il nome del server. | Nessuna unità | Sample-VM-1 |
Ultimo aggiornamento | In questo modo si ottiene la data e l'ora dell'ultimo aggiornamento del server | Data e ora | 4/9/2022, 12:24:02 PM |
Totale macchine virtuali | Numero di macchine virtuali in un nodo server. | Conteggio | 0 di 0 attivi |
Correre | Numero di macchine virtuali in esecuzione in un nodo del server. | Conteggio | 2 |
Fermato | Numero di macchine virtuali fermate in un nodo del server. | Conteggio | 3 |
Non riuscito | Il numero di macchine virtuali che hanno avuto un fallimento su un nodo server. | Conteggio | 2 |
Altro | Se la macchina virtuale si trova in uno degli stati seguenti (Unknown, Starting, Snapshotting, Saving, Stopping, Pausing, Resuming, Paused, Suspended), viene considerato come "Altro". | Conte | 2 |
Archiviazione
La tabella seguente fornisce lo stato di salute dei volumi e delle unità nel cluster.
Metrico | Descrizione | Unità | Esempio |
---|---|---|---|
Volumi | Nome del volume | Nessuna unità | CronologiaPrestazioniCluster |
Ultimo aggiornamento | Data e ora dell'ultimo aggiornamento dello spazio di archiviazione. | Data e ora | 14/4/2022, 2:58:55 PM |
Status | Stato del volume. | Normale, avviso, critico e altro. | Sano |
Capacità totale | Capacità totale del dispositivo in byte durante il periodo di report. | Byte | 2.5 GB |
Capacità disponibile | Capacità disponibile in byte durante il periodo di report. | Byte | 20B |
Iops | Operazioni di I/O al secondo. | Al secondo | 45/s |
Velocità effettiva | Numero di byte al secondo erogati dal gateway dell'applicazione. | Byte al secondo | 5B/s |
Latenza | Tempo necessario per il completamento della richiesta di I/O. | Secondo | 0.0016 s |
Resilienza | Capacità di ripristino da errori. Ottimizza la disponibilità dei dati. | Nessuna unità | Specchio a tre vie |
Deduplicazione | Processo di riduzione del numero fisico di byte di dati che devono essere archiviati su disco. | Disponibile o meno | Sì/No |
File system | Tipo di file system. | Nessuna unità | ReFS |
Prezzi di Azure Monitor
Quando si abilita la visualizzazione di monitoraggio, i log vengono raccolti da:
- Gestione della salute (Microsoft-windows-health/operational).
- Gestione SDDC (Microsoft-Windows-SDDC-Management/Operational; ID evento: 3000, 3001, 3002, 3003, 3004).
Vengono fatturati in base alla quantità di dati inseriti e alle impostazioni di conservazione dei dati dell'area di lavoro Log Analytics.
Azure Monitor ha un prezzo basato sul consumo e i primi 5 GB per account di fatturazione al mese sono gratuiti. Poiché i prezzi possono variare a causa di più fattori, ad esempio l'area di Azure in uso, visitare il calcolatore prezzi di Monitoraggio di Azure per i calcoli dei prezzi più aggiornati.