Fouten bij het maken van clusters in Azure HDInsight in AKS
Notitie
Op 31 januari 2025 wordt Azure HDInsight buiten gebruik gesteld op AKS. Vóór 31 januari 2025 moet u uw workloads migreren naar Microsoft Fabric of een gelijkwaardig Azure-product om te voorkomen dat uw workloads plotseling worden beëindigd. De resterende clusters in uw abonnement worden gestopt en verwijderd van de host.
Alleen basisondersteuning is beschikbaar tot de buitengebruikstellingsdatum.
Belangrijk
Deze functie is momenteel beschikbaar in preview. De aanvullende gebruiksvoorwaarden voor Microsoft Azure Previews bevatten meer juridische voorwaarden die van toepassing zijn op Azure-functies die bèta, in preview of anderszins nog niet beschikbaar zijn in algemene beschikbaarheid. Zie Azure HDInsight op AKS Preview-informatie voor meer informatie over deze specifieke preview. Voor vragen of suggesties voor functies dient u een aanvraag in op AskHDInsight met de details en volgt u ons voor meer updates in de Azure HDInsight-community.
In dit artikel wordt beschreven hoe u fouten kunt oplossen die kunnen optreden wanneer u Azure HDInsight maakt op AKS-clusters.
Sr. Nee | Foutbericht | Oorzaak | Oplossing |
---|---|---|---|
1 | InternalServerError UnrecognizableError | Deze fout kan duiden op een onjuiste sjabloon die wordt gebruikt. Databaseconnectors zijn momenteel alleen toegestaan via een ARM-sjabloon. Daarom is de validatie van de configuratie niet mogelijk op de sjabloon. | |
2 | InvalidClusterSpec - ServiceDependencyFailure - Ongeldige configuratie | Maximaal geheugen per knooppuntfout. | Raadpleeg de eigenschapswaardetypen voor maximale geheugenconfiguraties. |
3 | WaitingClusterResourcesReadyTimeOut - Metastoreservice ongelezen | Deze fout kan worden veroorzaakt doordat de containernaam alleen kleine letters, cijfers en afbreekstreepjes bevat. De containernaam moet beginnen met een letter of een getal. | Elk afbreekstreepje moet worden voorafgegaan door een niet-afbreekstreepje. De naam moet bovendien tussen 3 en 63 tekens lang zijn. |
4 | InvalidClusterSpec -Invalid configuration - ClusterUpsertActivity | Fout: Ongeldige configuratie-eigenschap hive.metastore.uri: may not be null . |
Raadpleeg de hive-connectordocumentatie. |
5 | InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call . |
Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. | |
6 | InternalServerError - ObjectDisposedException vindt plaats in RP-code. |
Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. | |
7 | PreconditionFailed - Bewerkingsfout vanwege quotumlimieten voor gebruikersabonnementen. |
Er is quotavalidatie voordat het cluster wordt gemaakt. Maar wanneer meerdere clusters tegelijkertijd onder hetzelfde abonnement worden gemaakt, is het mogelijk dat het eerste cluster het quotum in beslag neemt en het andere cluster uitvalt vanwege een tekort aan quota. | Controleer of er voldoende quotum is en probeer het cluster/clustergroep opnieuw te maken. |
8 | ReconcileApplicationSecurityGroupError - Interne AKS-fout |
Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. | |
9 | ResourceGroupBeingDeleted |
Tijdens het maken of bijwerken van HDI op AKS-resources verwijdert de gebruiker ook enkele resources in gerelateerde resourcegroepen. | Verwijder geen resources in HDI-gerelateerde resourcegroepen wanneer HDI op AKS-resources wordt gemaakt of bijgewerkt. |
10 | UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out . |
AKS-probleem: kan worden veroorzaakt door hoog verkeer in een bepaalde regio op het moment van de bewerking. | Probeer de bewerking na enige tijd opnieuw. Gebruik indien mogelijk een andere regio. |
11 | Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} |
Het serviceprincipe van 1 p is niet aan boord van de tenant. | Voer de opdracht uit om het serviceprincipe van 1 p in te richten op de nieuwe tenant om onboarding uit te voeren. |
12 | NotFound - ARM/AKS sdk error |
De gebruiker probeert HDI bij te werken in een AKS-cluster, maar de bijbehorende agentgroep is verwijderd. | De bijbehorende agentgroep is verwijderd. Het is niet raadzaam om de AKS-agentgroep rechtstreeks te bedienen. |
13 | AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi |
Geen toestemming om de bewerking uit te voeren. | Controleer of de service-principal-app-id die wordt vermeld in het foutbericht dat eigendom is van u. Zo ja, verleent u de machtiging op basis van het foutbericht. Open zo nee een ondersteuningsticket voor het Azure HDInsight-team. |
14 | DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespace failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} |
RP is onverwacht overgeschakeld naar een nieuw rolexemplaren. | Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. |
15 | EntityStoreOperationError - ARM/AKS sdk error |
Een databasebewerking is mislukt aan de AKS-zijde tijdens het bijwerken van het cluster. | Probeer de bewerking na enige tijd opnieuw. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
16 | InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} |
Deze fout is veroorzaakt door verschillende problemen. | Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. |
17 | InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} |
Deze fout is veroorzaakt door verschillende problemen. | voer de bewerking na enige tijd opnieuw uit. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
18 | InternalServerError - Null reference exception occurs in RP code . |
Deze fout is veroorzaakt door verschillende problemen. | Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. |
19 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} |
Deze fout is veroorzaakt door verschillende problemen. | Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. |
20 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} |
Deze fout is veroorzaakt door verschillende problemen. | Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. |
21 | OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. |
Er wordt een andere bewerking voor agentpools (schalen) uitgevoerd. Deze fout is veroorzaakt door het opnieuw opstarten van RP Service Fabric. | Wacht tot de vorige bewerking is voltooid voordat u een nieuwe bewerking start. Als het probleem zich blijft voordoen nadat het opnieuw is geprobeerd, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
22 | ReconcileVMSSAgentPoolFailed |
Er is quotavalidatie voordat het cluster wordt gemaakt. Maar wanneer meerdere clusters tegelijkertijd onder hetzelfde abonnement worden gemaakt, is het mogelijk dat het eerste cluster het quotum in beslag neemt en de andere clusters mislukken vanwege een tekort aan quota. | Controleer of er voldoende quotum is en probeer het cluster/clustergroep opnieuw te maken. |
23 | ReconcileVMSSAgentPoolFailed - Kan geen uitgaande verbinding tot stand brengen vanaf agents |
AKS/VMSS side issue: VM heeft een fout gerapporteerd. |
voer de bewerking na enige tijd opnieuw uit. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
24 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} |
Deze fout is veroorzaakt door een tijdelijk SQL-verbindingsprobleem. | voer de bewerking na enige tijd opnieuw uit. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
25 | NotLatestOperation - ARM/AKS SDK error |
De bewerking kan niet worden voortgezet. De bewerking is voorafgegaan door een andere bewerking of de informatie die nodig is voor de bewerking kan niet worden opgeslagen (of is nog niet opgeslagen). | voer de bewerking na enige tijd opnieuw uit. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
26 | ReconcileVMSSAgentPoolFailed - Agent pool drain failed |
Er is een probleem opgetreden bij het omlaag schalen. | Open een ondersteuningsticket voor het Azure HDInsight-team. |
27 | ResourceNotFound - ARM/AKS SDK error |
Dit foutprobleem treedt op wanneer een vereiste resource door de gebruiker is verwijderd of verwijderd. | Zorg ervoor dat de resource die in het foutbericht wordt vermeld, bestaat en voer de bewerking opnieuw uit. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
28 | InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.] . |
Er kan een time-out optreedt voor de HMS-initialisatie vanwege problemen met betrekking tot SQL Server of opslag. | Open een ondersteuningsticket voor het Azure HDInsight-team. |
29 | InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.] . |
Deze fout kan optreden omdat keyvault deze niet toegankelijk is of omdat de geheime sleutel niet beschikbaar is. In sommige zeldzame gevallen kan deze fout worden veroorzaakt door een tragere initialisatie van pod-id-infrastructuur op de clusterknooppunten. |
Als Log Analytics is ingeschakeld, controleert u de logboeken om secretprovider-validate job de bewerking reason.retry na enige tijd te identificeren. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket naar het Azure HDInsight-team. |
30 | FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} |
Deze fout kan optreden vanwege verschillende redenen, zoals een probleem met het ophalen van installatiekopieën of controllerpods die niet gereed zijn of een probleem met MSI. | Probeer de bewerking na enige tijd opnieuw, als het probleem zich blijft voordoen, een ondersteuningsticket naar het Azure HDInsight-team te openen. |
31 | FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} |
Deze fout kan optreden vanwege verschillende redenen, zoals een probleem met het ophalen van installatiekopieën of controllerpods die niet gereed zijn of een probleem met MSI. | Probeer de bewerking na enige tijd opnieuw, als het probleem zich blijft voordoen, een ondersteuningsticket naar het Azure HDInsight-team te openen. |
32 | InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}' . |
Deze fout kan optreden als de serviceconfiguratie bestaat uit onderdelen die niet zijn toegestaan. | Valideer de serviceconfiguratieonderdelen en probeer het opnieuw. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
33 | InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies . |
Deze fout kan optreden als gevolg van HMS, SPARK, YARN-services die niet actief zijn, kan deze fout betrekking hebben op opslag. | Open een ondersteuningsticket voor het Azure HDInsight-team. |
34 | WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. |
Open een ondersteuningsticket voor het Azure HDInsight-team. | |
35 | WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} |
Deze fout kan optreden als gevolg van HMS, SPARK, YARN-services die niet actief zijn, kan deze fout betrekking hebben op opslag. | Open een ondersteuningsticket voor het Azure HDInsight-team. |
36 | InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value] . |
Deze fout kan optreden wanneer niet-ondersteunde bestanden worden doorgegeven in de configuratie van services. | Valideer de serviceconfiguratieonderdelen en probeer het opnieuw. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
37 | InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." |
Ongeldige verificatieparameters: de opslaglocatie is niet toegankelijk. | Corrigeer verificatieparameters en probeer het opnieuw. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
38 | InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.] . |
Deze fout kan optreden wanneer het te lang duurt voordat de pod-id-resources op het knooppunt worden gestart wanneer de HMS-pod is gepland. | Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
Volgende stappen
- Problemen met clusterconfiguratie oplossen.