Errori di creazione del cluster in Azure HDInsight su AKS
Importante
Azure HDInsight su AKS è stato ritirato il 31 gennaio 2025. Scopri di più su con questo annuncio.
È necessario eseguire la migrazione dei carichi di lavoro a Microsoft Fabric o a un prodotto Azure equivalente per evitare la chiusura brusca dei carichi di lavoro.
Importante
Questa funzionalità è attualmente in anteprima. Le condizioni supplementari per l'utilizzo per le anteprime di Microsoft Azure includono termini legali più validi applicabili alle funzionalità di Azure in versione beta, in anteprima o altrimenti non ancora rilasciate nella disponibilità generale. Per informazioni su questa anteprima specifica, vedere informazioni sull'anteprima di Azure HDInsight nel servizio Azure Kubernetes. Per domande o suggerimenti sulle funzionalità, inviare una richiesta in AskHDInsight con i dettagli e segui Microsoft per altri aggiornamenti sulla community di Azure HDInsight.
Questo articolo descrive come risolvere e gestire gli errori che possono verificarsi quando si crea Azure HDInsight sui cluster AKS.
Sr. No | Messaggio di errore | Causa | Risoluzione |
---|---|---|---|
1 | ErroreInternoDelServer ErroreNonRiconoscibile | Questo errore potrebbe indicare un modello non corretto usato. Attualmente, i connettori di database sono consentiti solo tramite il modello ARM. Di conseguenza, la convalida della configurazione non è possibile nel modello. | |
2 | InvalidClusterSpec - ServiceDependencyFailure - Configurazione non valida | Memoria massima per ogni errore del nodo. | Fare riferimento alle configurazioni di memoria massime e ai tipi di valore della proprietà. |
3 | Timeout di Attesa delle Risorse Pronte del Cluster - Servizio Metastore non pronto | Questo errore potrebbe essere dovuto al nome del contenitore può contenere solo lettere minuscole, numeri e trattini. Il nome del contenitore deve iniziare con una lettera o un numero. | Ogni trattino deve essere preceduto da e seguito da un carattere non trattino. Il nome deve avere una lunghezza compresa tra 3 e 63 caratteri. |
4 | Configurazione -Invalid - Specifica di Cluster Non Valida - Attività di Inserimento/Integrazione Cluster | Errore: proprietà di configurazione non valida hive.metastore.uri: may not be null . |
Fare riferimento alla documentazione del connettore Hive. |
5 |
InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call . |
Ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight. | |
6 |
InternalServerError - ObjectDisposedException si verifica nel codice RP. |
Ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight. | |
7 |
PreconditionFailed - Errore dell'operazione a causa di limiti di quota per la sottoscrizione utente. |
È prevista la convalida della quota prima della creazione del cluster. Tuttavia, quando vengono creati più cluster nella stessa sottoscrizione contemporaneamente, è possibile che il primo cluster occupi la quota e l'altro non riesca a causa della carenza di quote. | Verificare che sia disponibile una quota sufficiente e riprovare a creare un cluster o un pool di cluster. |
8 |
ReconcileApplicationSecurityGroupError - Errore interno AKS |
Ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight. | |
9 | ResourceGroupBeingDeleted |
Durante la creazione o l'aggiornamento delle risorse su AKS, l'utente elimina anche alcune risorse nei gruppi di risorse associati. | Non eliminare le risorse nei gruppi di risorse correlati a HDI durante la creazione o l'aggiornamento di HDI su risorse AKS. |
10 |
UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out . |
Problema AKS: potrebbe dipendere da un traffico elevato in una particolare regione al momento dell'operazione. | Ripetere l'operazione dopo qualche tempo. Se possibile, usare un'altra area. |
11 | Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} |
Il principio di servizio 1-p non è implementato nel tenant. | Eseguire il comando per provisionare il principio di servizio 1-p nel nuovo tenant da integrare. |
12 | NotFound - ARM/AKS sdk error |
L'utente tenta di aggiornare HDI nel cluster del servizio Azure Kubernetes, ma il pool di agenti corrispondente è stato eliminato. | Il pool di agenti corrispondente è stato eliminato. Non è consigliabile gestire direttamente il pool di agenti di AKS. |
13 | AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi |
Mancanza di autorizzazione per eseguire l'operazione. | Controlla se l'ID dell'applicazione del principio di servizio indicato nel messaggio di errore appartiene a te. In caso affermativo, concedere l'autorizzazione in base al messaggio di errore. In caso contrario, aprire un ticket di supporto al team di Azure HDInsight. |
14 | DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespace failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} |
RP è passato a una nuova istanza del ruolo in modo imprevisto. | ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight. |
15 | EntityStoreOperationError - ARM/AKS sdk error |
Un'operazione di database non è riuscita su AKS durante l'aggiornamento del cluster. | Ripetere l'operazione dopo qualche tempo. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight. |
16 | InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} |
Questo errore è stato causato da vari problemi. | ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight. |
17 | InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} |
Questo errore è stato causato da vari problemi. | ripetere l'operazione dopo qualche tempo. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight. |
18 |
InternalServerError - Null reference exception occurs in RP code . |
Questo errore è stato causato da vari problemi. | Ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight. |
19 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} |
Questo errore è stato causato da vari problemi. | ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight. |
20 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} |
Questo errore è stato causato da vari problemi. | ripetere l'operazione o aprire un ticket di supporto al team di Azure HDInsight. |
21 | OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. |
È in corso un'altra operazione del pool di agenti (ridimensionamento). Questo errore è stato causato dal riavvio di Service Fabric rp. | Attendere il completamento dell'operazione precedente prima di avviare una nuova operazione. Se il problema persiste dopo un nuovo tentativo, aprire un ticket di supporto al team di Azure HDInsight. |
22 | ReconcileVMSSAgentPoolFailed |
È prevista la convalida della quota prima della creazione del cluster. Tuttavia, quando vengono creati più cluster nella stessa sottoscrizione contemporaneamente, è possibile che il primo cluster occupi la quota e gli altri non riescano a causa della carenza di quote. | Verificare che sia disponibile una quota sufficiente e riprovare a creare un cluster o un pool di cluster. |
23 |
ReconcileVMSSAgentPoolFailed - Impossibile stabilire una connessione in uscita dagli agenti |
AKS/VMSS problema secondario: la macchina virtuale ha segnalato un errore. |
ripetere l'operazione dopo qualche tempo. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight. |
24 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} |
Questo errore è stato causato da un problema di connessione SQL temporaneo. | ripetere l'operazione dopo qualche tempo. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight. |
25 | NotLatestOperation - ARM/AKS SDK error |
L'operazione non può continuare. L'operazione è stata annullata da un'altra o le informazioni necessarie per l'operazione non sono state salvate (o non sono state ancora salvate). | ripetere l'operazione dopo qualche tempo. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight. |
26 | ReconcileVMSSAgentPoolFailed - Agent pool drain failed |
Si è verificato un problema con l'operazione di riduzione delle prestazioni. | Aprire un ticket di supporto al team di Azure HDInsight. |
27 | ResourceNotFound - ARM/AKS SDK error |
Questo errore si verifica quando l'utente rimuove o elimina una risorsa richiesta. | Assicurarsi che la risorsa menzionata nel messaggio di errore esista, quindi ripetere l'operazione. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight. |
28 |
InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.] . |
L'inizializzazione HMS potrebbe andare in timeout a causa di problemi correlati a SQL Server o all'archiviazione. | Aprire un ticket di supporto al team di Azure HDInsight. |
29 |
InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.] . |
Questo errore può verificarsi a causa di keyvault inaccessibile o della chiave privata non disponibile. In alcuni rari casi, questo errore potrebbe essere dovuto a un'inizializzazione più lenta dell'infrastruttura di identità del pod nei nodi del cluster. |
Se Log Analytics è abilitato, controllare i log di secretprovider-validate job per identificare il motivo. Riprovare l'operazione dopo qualche tempo, se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight. |
30 | FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} |
Questo errore può verificarsi per vari motivi, come un problema nel recupero delle immagini, i pod del controller non pronti o un problema con l'identità del servizio gestito. | Ripetere l'operazione dopo un certo periodo di tempo, se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight. |
31 | FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} |
Questo errore può verificarsi per diversi motivi, come un problema di scaricamento delle immagini, i pod controller che non sono pronti, oppure un problema con l'identità del servizio gestito (MSI). | Ripetere l'operazione dopo un certo periodo di tempo, se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight. |
32 |
InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}' . |
Questo errore può verificarsi se la configurazione del servizio è costituita da componenti non consentiti. | Convalidare i componenti di configurazione del servizio e riprovare. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight. |
33 |
InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies . |
Questo errore può verificarsi a causa di HMS, SPARK, servizi YARN non aggiornati. Questo errore potrebbe essere correlato all'archiviazione. | Aprire un ticket di supporto al team di Azure HDInsight. |
34 | WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. |
Aprire un ticket di supporto al team di Azure HDInsight. | |
35 | WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} |
Questo errore può verificarsi a causa di HMS, SPARK, servizi YARN non aggiornati. Questo errore potrebbe essere correlato all'archiviazione. | Aprire un ticket di supporto al team di Azure HDInsight. |
36 |
InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value] . |
Questo errore può verificarsi quando i file non supportati vengono passati nella configurazione dei servizi. | Convalidare i componenti di configurazione del servizio e riprovare. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight. |
37 | InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." |
Parametri di autenticazione non validi: il percorso di archiviazione non è accessibile. | Correggere i parametri di autenticazione e riprovare. Se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight. |
38 |
InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.] . |
Questo errore può verificarsi quando le risorse di identità del pod richiedono troppo tempo per l'avvio nel nodo quando è pianificato il pod HMS. | Ripetere l'operazione, se il problema persiste, aprire un ticket di supporto al team di Azure HDInsight. |