Condividi tramite


Risolvere gli errori comuni di correzione automatica dei nodi

Quando servizio Azure Kubernetes (servizio Azure Kubernetes) rileva un nodo con NotReady stato per più di cinque minuti, tenta di ripristinare automaticamente il nodo. Il ripristino automatico dei nodi è un servizio di lavoro ottimale. Non garantisce che il nodo possa essere ripristinato in uno stato integro. Per altre informazioni, vedere Processo di riparazione automatica dei nodi.

Durante il processo di ripristino automatico del nodo, il servizio Azure Kubernetes avvia rebootle azioni , reimagee redeploy nel nodo non integro. Gli errori possono verificarsi a causa di vari motivi e codici di errore vengono individuati tramite eventi Kubernetes. È possibile usare gli eventi Kubernetes per monitorare lo stato del nodo e le azioni di ripristino automatico.

Questo articolo fornisce possibili cause e soluzioni agli errori comuni di correzione automatica dei nodi e descrive le procedure consigliate per il monitoraggio del processo di correzione automatica del nodo.

Prerequisiti

Controllare gli eventi Kubernetes seguenti per identificare il tipo di errore di correzione automatica del nodo:

Motivo Messaggio dell'evento Descrizione
NodeRebootError L'azione di ripristino automatico del nodo non è riuscita a causa di un errore dell'operazione: [codice errore qui] Generato quando si verifica un errore con l'azione reboot .
NodeReimageError L'azione di ripristino automatico del nodo non è riuscita a causa di un errore dell'operazione: [codice errore qui] Generato quando si verifica un errore con l'azione reimage .
NodeRedeployError L'azione di ridistribuzione del nodo non è riuscita a causa di un errore dell'operazione: [codice di errore qui] Generato quando si verifica un errore con l'azione redeploy .

Note

Poiché il nodo è già in uno stato non integro prima del processo di ripristino automatico, nella maggior parte dei casi, gli errori di correzione automatica del nodo non influiscono sul cluster o sulle applicazioni. Quando si verificano errori di correzione automatica del nodo, è consigliabile provare a ripristinare il nodo seguendo le istruzioni riportate in Risoluzione dei problemi di base degli errori node non pronti. Se non è possibile ripristinarlo in uno Succeeded stato e visualizzare gli errori persistenti segnalati dal ripristino automatico del nodo, contattare supporto tecnico di Azure per assistenza.

Codici errore comuni

Codice di errore Causa e soluzione
VMExtensionProvisioningError Non è stato possibile effettuare il provisioning di una o più estensioni di macchina virtuale nella macchina virtuale. Per altre informazioni sui possibili tipi di errore e sui passaggi per la risoluzione dei problemi, vedere Risolvere i problemi relativi al codice di errore ERR_VHD_FILE_NOT_FOUND (124). Per determinare l'errore esatto di provisioning dell'estensione della macchina virtuale nel nodo, visualizzare i dettagli dell'errore nella portale di Azure.
InvalidParameter Questo errore si verifica se il processo di ripristino automatico del nodo tenta di accedere a un nodo che non esiste più.
scaleSetNameAndInstanceIDFromProviderID non riuscito Questo problema si verifica quando il provisioning del nodo non viene eseguito correttamente.
Autenticazione ManagedIdentityCredential non riuscita Questo problema si verifica quando il nodo non viene inizializzato correttamente.
VMRedeploymentFailed Questo errore si verifica quando si tenta di ridistribuire il nodo. In questo caso, il pool di nodi potrebbe entrare in uno stato di errore. Per altre informazioni sulle possibili cause e sui passaggi per la risoluzione dei problemi, vedere Risolvere i problemi servizio Azure Kubernetes cluster o nodi in uno stato di errore.
TooManyVMRedeploymentRequests Questo errore si verifica quando il cluster supera il limite per le richieste di ridistribuzione delle macchine virtuali. Redeploy è una delle azioni di correzione automatica del nodo. Questo errore indica che l'azione redeploy non è in grado di ripristinare il nodo. Per risolvere il problema Node Not Ready, vedere Risoluzione dei problemi di base degli errori node non pronti.
OutboundConnectivityNotEnabledOnVMSS Questo errore si verifica quando il nodo o il set di scalabilità di macchine virtuali complessivo non dispone dell'accesso in uscita abilitato. Per risolvere questo problema, abilitare l'accesso in uscita sicuro per il set di scalabilità usando un metodo più adatto per l'applicazione. Per altre informazioni, vedere "OutboundConnectivityNotEnabledOnVM. Nessuna connettività in uscita configurata per la macchina virtuale."

Procedure consigliate per il monitoraggio del ripristino automatico dei nodi

  • Il servizio Azure Kubernetes archivia gli eventi Kubernetes dall'ultima ora per impostazione predefinita. È consigliabile abilitare Informazioni dettagliate contenitore in modo che sia possibile archiviare gli eventi per un massimo di 90 giorni. È anche possibile eseguire query sugli eventi e configurare gli avvisi per rilevare rapidamente gli errori di correzione automatica del nodo.

  • Il ripristino automatico dei nodi è un servizio di lavoro ottimale. Non garantisce che il nodo possa essere ripristinato in uno Ready stato. È consigliabile monitorare e impostare attivamente gli avvisi per i problemi node non pronti e risolvere questi problemi manualmente. Per altre informazioni, vedere La risoluzione dei problemi di base di Node Not Ready.

Contattaci per ricevere assistenza

In caso di domande o bisogno di assistenza, creare una richiesta di supporto tecnico oppure formula una domanda nel Supporto della community di Azure. È possibile anche inviare un feedback sul prodotto al feedback della community di Azure.