Errores de creación de clústeres en Azure HDInsight en AKS
Importante
Azure HDInsight en AKS se retiró el 31 de enero de 2025. Obtenga más información con este anuncio.
Debe migrar las cargas de trabajo a microsoft Fabric o un producto equivalente de Azure para evitar la terminación repentina de las cargas de trabajo.
Importante
Esta característica está actualmente en versión preliminar. Los Términos de uso complementarios para las versiones preliminares de Microsoft Azure incluyen más términos legales que se aplican a las características de Azure que se encuentran en versión beta, en versión preliminar o, de lo contrario, aún no se han publicado en disponibilidad general. Para obtener información sobre esta versión preliminar específica, consulte información de la versión preliminar de Azure HDInsight en AKS. Para preguntas o sugerencias de características, envíe una solicitud en AskHDInsight con los detalles y síganos para obtener más actualizaciones sobre Comunidad de Azure HDInsight.
En este artículo se describe cómo solucionar y resolver errores que podrían producirse al crear Azure HDInsight en clústeres de AKS.
Sr. No | Mensaje de error | Causa | Resolución |
---|---|---|---|
1 | ErrorInternoDelServidor ErrorIrreconocible | Este error podría indicar que se ha usado una plantilla incorrecta. Actualmente, los conectores de base de datos solo se permiten a través de la plantilla de ARM. Por lo tanto, la validación de la configuración no es posible en la plantilla. | |
2 | InvalidClusterSpec - ServiceDependencyFailure - Configuración inválida | Número máximo de memoria por error de nodo. | Consulte las configuraciones máximas de memoria y los tipos de propiedad de valor. |
3 | TiempoDeEsperaParaRecursosDeClústerListosAgotado - ServicioDeMetadatos no disponible | Esto podría deberse a que el nombre del contenedor solo puede contener letras minúsculas, números y guiones. El nombre del contenedor debe comenzar con una letra o un número. | Cada guión debe ir precedido y seguido de un carácter sin guion. El nombre también debe tener entre 3 y 63 caracteres. |
4 | InvalidClusterSpec -Invalid - configuración de ClusterUpsertActivity | Error: la propiedad de configuración no válida hive.metastore.uri: may not be null . |
Consulte la documentación del conector de Hive. |
5 |
InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call . |
Vuelva a intentar la operación o contacte al equipo de soporte de Azure HDInsight. | |
6 |
InternalServerError - ObjectDisposedException aparece en el código RP. |
Vuelva a intentar la operación o abra una incidencia de soporte técnico con el equipo de Azure HDInsight. | |
7 |
PreconditionFailed : error de operación debido a los límites de cuota de la suscripción de usuario. |
Hay validación de cuota antes de la creación del clúster. Pero cuando se crean varios clústeres en la misma suscripción al mismo tiempo, es posible que el primer clúster ocupe la cuota y los otros fallen debido a la escasez de cuota. | Confirme que hay suficiente cuota y vuelva a intentar la creación del clúster o del grupo de clústeres. |
8 |
ReconcileApplicationSecurityGroupError : error interno de AKS |
Intente la operación nuevamente o abra un ticket de soporte al equipo de Azure HDInsight. | |
9 | ResourceGroupBeingDeleted |
Durante la HDI en la creación o actualización de recursos de AKS, el usuario también elimina algunos recursos en grupos de recursos asociados. | No elimine los recursos de los grupos de recursos relacionados con HDI cuando se crea o actualiza HDI en los recursos de AKS. |
10 |
UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out . |
Problema de AKS: podría deberse a un tráfico elevado en una región determinada en el momento de la operación. | Vuelva a intentar la operación después de algún tiempo. Si es posible, use otra región. |
11 | Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} |
El principio de servicio 1-p no está incorporado al inquilino. | Ejecute el comando para aprovisionar el principio de servicio 1-p en el nuevo inquilino que se va a incorporar. |
12 | NotFound - ARM/AKS sdk error |
El usuario intenta actualizar HDI en el clúster de AKS, pero se ha eliminado el grupo de agentes correspondiente. | Se ha eliminado el grupo de agentes correspondiente. No se recomienda gestionar directamente el grupo de agentes de AKS. |
13 | AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi |
Falta de permiso para realizar la operación. | Compruebe si el identificador de la aplicación del principal de servicio mencionado en el mensaje de error, le pertenece a usted. Si es así, conceda el permiso según el mensaje de error. Si no, abra un ticket de soporte al equipo de Azure HDInsight. |
14 | DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespace failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} |
RP cambió a una nueva instancia de rol inesperadamente. | vuelva a intentar la operación o abra una solicitud de soporte con el equipo de Azure HDInsight. |
15 | EntityStoreOperationError - ARM/AKS sdk error |
Error en una operación de base de datos en AKS durante la actualización del clúster. | Vuelva a intentar la operación después de algún tiempo. Si el problema persiste, abra un ticket de soporte al equipo de Azure HDInsight. |
16 | InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} |
Este error se debe a varios problemas. | vuelva a intentar la operación o abra un ticket de soporte al equipo de Azure HDInsight. |
17 | InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} |
Este error se debe a varios problemas. | vuelva a intentar la operación después de algún tiempo. Si el problema persiste, abra una incidencia de soporte técnico con el equipo de Azure HDInsight. |
18 |
InternalServerError - Null reference exception occurs in RP code . |
Este error se debe a varios problemas. | Vuelva a intentar la operación o abra un ticket de soporte con el equipo de Azure HDInsight. |
19 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} |
Este error se debe a varios problemas. | vuelva a intentar la operación o abra una solicitud de soporte técnico dirigida al equipo de Azure HDInsight. |
20 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} |
Este error se debe a varios problemas. | vuelva a intentar la operación o abra un ticket de soporte para el equipo de Azure HDInsight. |
21 | OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. |
Hay otra operación de grupo de agentes (escalado) en curso. Este error se debe al reinicio de RP Service Fabric. | Espere a que finalice la operación anterior antes de iniciar una nueva operación. Si el problema persiste después de volver a intentarlo, abra una incidencia de soporte técnico al equipo de Azure HDInsight. |
22 | ReconcileVMSSAgentPoolFailed |
Hay validación de cuota antes de la creación del clúster. Pero cuando se crean varios clústeres en la misma suscripción al mismo tiempo, es posible que el primer clúster agote la cuota y que los otros clústeres fallen por falta de cuota. | Confirme que hay suficiente cuota y vuelva a intentar la creación del clúster o del grupo de clústeres. |
23 |
ReconcileVMSSAgentPoolFailed : no se puede establecer la conexión saliente de los agentes |
AKS/VMSS problema secundario: la máquina virtual ha informado de un error. |
vuelva a intentar la operación después de algún tiempo. Si el problema persiste, abra una incidencia de soporte técnico en el equipo de Azure HDInsight. |
24 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} |
Este error se debe a un problema de conexión SQL transitorio. | vuelva a intentar la operación después de algún tiempo. Si el problema persiste, abra un ticket de soporte al equipo de Azure HDInsight. |
25 | NotLatestOperation - ARM/AKS SDK error |
La operación no puede continuar. La operación se ha reemplazado por otra o la información necesaria por la operación no se pudo guardar (o aún no se ha guardado). | vuelva a intentar la operación después de algún tiempo. Si el problema persiste, abra un ticket de soporte al equipo de Azure HDInsight. |
26 | ReconcileVMSSAgentPoolFailed - Agent pool drain failed |
Hubo un problema con la operación de reducción. | Abra una incidencia de soporte técnico para el equipo de Azure HDInsight. |
27 | ResourceNotFound - ARM/AKS SDK error |
Este problema de error se produce cuando el usuario quita o elimina un recurso necesario. | Asegúrese de que el recurso mencionado en el mensaje de error existe y vuelva a intentar la operación. Si el problema persiste, abra un ticket de soporte al equipo de Azure HDInsight. |
28 |
InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.] . |
La inicialización de HMS puede agotar el tiempo de espera debido a problemas relacionados con SQL Server o con el almacenamiento. | Abra una incidencia de soporte técnico para el equipo de Azure HDInsight. |
29 |
InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.] . |
Este error puede producirse debido a que no se puede acceder a keyvault o la clave secreta no está disponible. En algunos casos poco frecuentes, este error podría deberse a una inicialización más lenta de la infraestructura de identidad de pod en los nodos del clúster. |
Si tiene Log Analytics habilitado, compruebe los registros de secretprovider-validate job para identificar la razón. Vuelva a intentar la operación después de algún tiempo; si el problema persiste, abra un ticket de soporte con el equipo de Azure HDInsight. |
30 | FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} |
Este error puede producirse debido a varios motivos, como el problema de extracción de imágenes o los pods del controlador no listos, o a un problema con MSI. | intente realizar la operación nuevamente; si el problema persiste, abra un ticket de soporte con el equipo de Azure HDInsight. |
31 | FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} |
Este error puede producirse debido a varios motivos, como el problema de extracción de imágenes o los pods del controlador no listos, o a un problema con MSI. | Intente de nuevo la operación después de un tiempo. Si el problema persiste, abra un ticket de soporte con el equipo de Azure HDInsight. |
32 |
InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}' . |
Este error puede producirse si la configuración del servicio consta de componentes que no están permitidos. | Valide los componentes de configuración del servicio y vuelva a intentarlo. Si el problema persiste, abra una incidencia de soporte técnico en el equipo de Azure HDInsight. |
33 |
InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies . |
Este error puede producirse debido a que los servicios HMS,SPARK,YARN no están actualizados, este error podría estar relacionado con el almacenamiento. | Envíe una incidencia de soporte técnico para el equipo de Azure HDInsight. |
34 | WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. |
Abra un ticket de soporte para el equipo de Azure HDInsight. | |
35 | WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} |
Este error puede producirse debido a que los servicios HMS,SPARK,YARN no están actualizados, este error podría estar relacionado con el almacenamiento. | Abra una incidencia de soporte técnico para el equipo de Azure HDInsight. |
36 |
InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value] . |
Este error puede producirse cuando se pasan archivos no admitidos en la configuración de servicios. | Valide los componentes de configuración del servicio y vuelva a intentarlo. Si el problema persiste, abra una incidencia de soporte técnico en el equipo de Azure HDInsight. |
37 | InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." |
Parámetros de autenticación no válidos: la ubicación de almacenamiento no es accesible. | Corrija los parámetros de autenticación y vuelva a intentarlo. Si el problema persiste, abra un ticket de soporte para el equipo de Azure HDInsight. |
38 |
InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.] . |
Este error puede producirse cuando los recursos de identidad del pod tardan demasiado tiempo en iniciarse en el nodo cuando se programa el pod hmS. | vuelva a intentar la operación, si el problema persiste, abra una incidencia de soporte técnico en el equipo de Azure HDInsight. |