Fouten bij het maken van clusters in Azure HDInsight in AKS
Belangrijk
Azure HDInsight op AKS is op 31 januari 2025 buiten gebruik gesteld. Leer meer over met deze aankondiging.
U moet uw workloads migreren naar Microsoft Fabric- of een gelijkwaardig Azure-product om plotselinge beëindiging van uw workloads te voorkomen.
Belangrijk
Deze functie is momenteel beschikbaar als preview-versie. De aanvullende gebruiksvoorwaarden voor Microsoft Azure Previews meer juridische voorwaarden bevatten die van toepassing zijn op Azure-functies die bèta, in preview of anderszins nog niet in algemene beschikbaarheid zijn vrijgegeven. Voor meer informatie over deze specifieke preview, zie Azure HDInsight op AKS preview-informatie. Voor vragen of suggesties voor functies dient u een aanvraag in op AskHDInsight- met de details en volgt u ons voor meer updates over Azure HDInsight Community-.
In dit artikel wordt beschreven hoe u fouten kunt oplossen die kunnen optreden wanneer u Azure HDInsight maakt op AKS-clusters.
Sr. Nee | Foutmelding | Oorzaak | Resolutie |
---|---|---|---|
1 | InterneServerFout OnherkenbareFout | Deze fout kan duiden op een onjuiste sjabloon die wordt gebruikt. Database-connectors zijn momenteel alleen toegestaan via een ARM-template. Daarom is de validatie van de configuratie niet mogelijk op de sjabloon. | |
2 | InvalidClusterSpec - ServiceDependencyFailure - Ongeldige configuratie | Maximaal geheugen per knooppuntfout. | Raadpleeg de maximale geheugenconfiguraties eigenschapswaardetypen. |
3 | WaitingClusterResourcesReadyTimeOut - Metastoreservice niet gereed | Deze fout kan worden veroorzaakt doordat de containernaam alleen kleine letters, cijfers en afbreekstreepjes bevat. De containernaam moet beginnen met een letter of een getal. | Elk afbreekstreepje moet worden voorafgegaan door en gevolgd door een niet-afbreekstreepje. De naam moet ook tussen 3 en 63 tekens lang zijn. |
4 | InvalidClusterSpec -Invalid configuratie - ClusterUpsertActivity | Fout: ongeldige configuratie-eigenschap hive.metastore.uri: may not be null . |
Raadpleeg de documentatie van de Hive-connector. |
5 |
InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call . |
Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. | |
6 |
InternalServerError - ObjectDisposedException komt voor in de RP-code. |
Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. | |
7 |
PreconditionFailed : bewerkingsfout vanwege quotumlimieten voor gebruikersabonnementen. |
Er is quotavalidatie voordat het cluster wordt gemaakt. Maar wanneer meerdere clusters tegelijkertijd onder hetzelfde abonnement worden gemaakt, is het mogelijk dat het eerste cluster het quotum in beslag neemt en het andere cluster uitvalt vanwege een tekort aan quota. | Controleer of het quotum voldoende is en probeer het cluster of de clustergroep opnieuw te maken. |
8 |
ReconcileApplicationSecurityGroupError - Interne AKS-fout |
Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. | |
9 | ResourceGroupBeingDeleted |
Tijdens het maken of bijwerken van HDI op AKS-resources verwijdert de gebruiker ook enkele resources in gerelateerde resourcegroepen. | Verwijder geen resources in HDI-gerelateerde resourcegroepen wanneer HDI binnen AKS-resources wordt gecreëerd of bijgewerkt. |
10 |
UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out . |
AKS-probleem: kan worden veroorzaakt door hoog verkeer in een bepaalde regio op het moment van de bewerking. | Voer de bewerking na enige tijd opnieuw uit. Gebruik indien mogelijk een andere regio. |
11 | Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} |
Het 1-p serviceprincipe is niet toegewezen aan de tenant. | Voer de opdracht uit om het 1-p serviceprincipe in te richten voor de nieuwe tenant voor onboarding. |
12 | NotFound - ARM/AKS sdk error |
De gebruiker probeert HDI bij te werken in een AKS-cluster, maar de bijbehorende agentgroep is verwijderd. | De bijbehorende agentgroep is verwijderd. Het is niet raadzaam om de AKS-agentgroep rechtstreeks te bedienen. |
13 | AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi |
Geen toestemming om de bewerking uit te voeren. | Controleer of de service-principal-app-id die in de foutmelding wordt vermeld, van u is. Zo ja, verleent u de machtiging op basis van het foutbericht. Open zo nee een ondersteuningsticket voor het Azure HDInsight-team. |
14 | DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespace failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} |
RP is onverwacht overgeschakeld naar een nieuwe rolinstantie. | Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. |
15 | EntityStoreOperationError - ARM/AKS sdk error |
Een databasebewerking is mislukt aan de AKS-zijde tijdens het bijwerken van het cluster. | Voer de bewerking na enige tijd opnieuw uit. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
16 | InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} |
Deze fout is veroorzaakt door verschillende problemen. | Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. |
17 | InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} |
Deze fout is veroorzaakt door verschillende problemen. | voer de bewerking na enige tijd opnieuw uit. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
18 |
InternalServerError - Null reference exception occurs in RP code . |
Deze fout is veroorzaakt door verschillende problemen. | Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. |
19 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} |
Deze fout is veroorzaakt door verschillende problemen. | Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. |
20 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} |
Deze fout is veroorzaakt door verschillende problemen. | Probeer de bewerking opnieuw of open een ondersteuningsticket naar het Azure HDInsight-team. |
21 | OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. |
Er wordt een andere bewerking voor agentpools (Schalen) uitgevoerd. Deze fout is veroorzaakt door het opnieuw opstarten van RP Service Fabric. | Wacht tot de vorige bewerking is voltooid voordat u een nieuwe bewerking start. Als het probleem zich blijft voordoen nadat het opnieuw is geprobeerd, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
22 | ReconcileVMSSAgentPoolFailed |
Er is quotavalidatie voordat het cluster wordt gemaakt. Maar wanneer meerdere clusters tegelijkertijd onder hetzelfde abonnement worden gemaakt, is het mogelijk dat het eerste cluster het quotum in beslag neemt en de andere clusters mislukken vanwege een tekort aan quota. | Controleer of er voldoende quotum is en probeer de cluster/clustergroep opnieuw te maken. |
23 |
ReconcileVMSSAgentPoolFailed - Kan geen uitgaande verbinding tot stand brengen vanaf agents |
AKS/VMSS nevenprobleem: VM heeft een fout gerapporteerd. |
voer de bewerking na enige tijd opnieuw uit. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
24 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} |
Deze fout is veroorzaakt door een tijdelijk SQL-verbindingsprobleem. | voer de bewerking na enige tijd opnieuw uit. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
25 | NotLatestOperation - ARM/AKS SDK error |
De bewerking kan niet worden voortgezet. De bewerking is voorafgegaan door een andere bewerking of de informatie die nodig is voor de bewerking kan niet worden opgeslagen (of is nog niet opgeslagen). | voer de bewerking na enige tijd opnieuw uit. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
26 | ReconcileVMSSAgentPoolFailed - Agent pool drain failed |
Er is een probleem opgetreden bij het omlaag schalen. | Open een ondersteuningsticket voor het Azure HDInsight-team. |
27 | ResourceNotFound - ARM/AKS SDK error |
Dit foutprobleem treedt op wanneer een vereiste resource door de gebruiker is verwijderd of verwijderd. | Zorg ervoor dat de resource die in het foutbericht wordt vermeld, bestaat en voer de bewerking opnieuw uit. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
28 |
InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.] . |
Er kan een time-out optreden voor de HMS-initialisatie vanwege problemen met de SQL-server of opslag. | Open een ondersteuningsticket voor het Azure HDInsight-team. |
29 |
InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.] . |
Deze fout kan optreden omdat keyvault niet toegankelijk is of de geheime sleutel niet beschikbaar is. In sommige zeldzame gevallen kan deze fout worden veroorzaakt door een tragere initialisatie van pod-id-infrastructuur op de clusterknooppunten. |
Als Log Analytics is ingeschakeld, controleert u de logboeken van secretprovider-validate job om de bewerking reason.retry na enige tijd te identificeren. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
30 | FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} |
Deze fout kan optreden vanwege verschillende redenen, zoals een probleem met het ophalen van afbeeldingen, controllerpods die niet gereed zijn, of een probleem met MSI. | Probeer de bewerking na enige tijd opnieuw, als het probleem zich blijft voordoen, een ondersteuningsticket naar het Azure HDInsight-team te openen. |
31 | FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} |
Deze fout kan optreden vanwege verscheidene redenen, zoals een probleem met het ophalen van afbeeldingen, controllerpods die niet gereed zijn, of een probleem met MSI. | Probeer de bewerking na enige tijd opnieuw, als het probleem zich blijft voordoen, een ondersteuningsticket naar het Azure HDInsight-team te openen. |
32 |
InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}' . |
Deze fout kan optreden als de serviceconfiguratie bestaat uit onderdelen die niet zijn toegestaan. | Valideer de serviceconfiguratieonderdelen en probeer het opnieuw. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
33 |
InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies . |
Deze fout kan optreden als gevolg van HMS, SPARK, YARN-services die niet actief zijn, kan deze fout betrekking hebben op opslag. | Open een ondersteuningsticket voor het Azure HDInsight-team. |
34 | WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. |
Open een ondersteuningsticket voor het Azure HDInsight-team. | |
35 | WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} |
Deze fout kan optreden als gevolg van HMS, SPARK, YARN-services die niet actief zijn, kan deze fout betrekking hebben op opslag. | Open een ondersteuningsticket voor het Azure HDInsight-team. |
36 |
InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value] . |
Deze fout kan optreden wanneer niet-ondersteunde bestanden worden doorgegeven in de configuratie van services. | Valideer de serviceconfiguratieonderdelen en probeer het opnieuw. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
37 | InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." |
Ongeldige verificatieparameters: de opslaglocatie is niet toegankelijk. | Corrigeer verificatieparameters en probeer het opnieuw. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |
38 |
InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.] . |
Deze fout kan optreden als de pod-identiteitsbronnen te lang nodig hebben om op het knooppunt te starten wanneer de HMS-pod is ingepland. | Probeer de bewerking opnieuw. Als het probleem zich blijft voordoen, opent u een ondersteuningsticket voor het Azure HDInsight-team. |