Udostępnij za pośrednictwem


Błędy tworzenia klastra w usłudze Azure HDInsight w usłudze AKS

Uwaga

Wycofamy usługę Azure HDInsight w usłudze AKS 31 stycznia 2025 r. Przed 31 stycznia 2025 r. należy przeprowadzić migrację obciążeń do usługi Microsoft Fabric lub równoważnego produktu platformy Azure, aby uniknąć nagłego zakończenia obciążeń. Pozostałe klastry w ramach subskrypcji zostaną zatrzymane i usunięte z hosta.

Tylko podstawowa pomoc techniczna będzie dostępna do daty wycofania.

Ważne

Ta funkcja jest aktualnie dostępna jako funkcja podglądu. Dodatkowe warunki użytkowania dla wersji zapoznawczych platformy Microsoft Azure obejmują więcej warunków prawnych, które dotyczą funkcji platformy Azure, które znajdują się w wersji beta, w wersji zapoznawczej lub w inny sposób nie zostały jeszcze wydane w wersji ogólnodostępnej. Aby uzyskać informacje o tej konkretnej wersji zapoznawczej, zobacz Informacje o wersji zapoznawczej usługi Azure HDInsight w usłudze AKS. W przypadku pytań lub sugestii dotyczących funkcji prześlij żądanie w usłudze AskHDInsight , aby uzyskać szczegółowe informacje i postępuj zgodnie z nami, aby uzyskać więcej aktualizacji w społeczności usługi Azure HDInsight.

W tym artykule opisano sposób rozwiązywania problemów i usuwania błędów, które mogą wystąpić podczas tworzenia usługi Azure HDInsight w klastrach usługi AKS.

Sr. Nr Komunikat o błędzie Przyczyna Rozwiązanie
1 InternalServerError UnrecognizableError Ten błąd może wskazywać na nieprawidłowy używany szablon. Obecnie łączniki bazy danych są dozwolone tylko za pośrednictwem szablonu usługi ARM. W związku z tym weryfikacja konfiguracji nie jest możliwa w szablonie.
2 InvalidClusterSpec — ServiceDependencyFailure — nieprawidłowa konfiguracja Maksymalna ilość pamięci na błąd węzła. Zapoznaj się z typami wartości właściwości maksymalna konfiguracji pamięci.
3 WaitingClusterResourcesReadyTimeOut — nieprzeczytana usługa magazynu metadanych Ten błąd może być spowodowany nazwą kontenera może zawierać tylko małe litery, cyfry i łączniki. Nazwa kontenera musi zaczynać się literą lub cyfrą. Każdy łącznik musi być poprzedzony znakiem nonhyphen. Nazwa musi również mieć długość od 3 do 63 znaków.
100 InvalidClusterSpec - Nieprawidłowa konfiguracja — ClusterUpsertActivity Błąd: Nieprawidłowa właściwość hive.metastore.uri: may not be nullkonfiguracji . Zapoznaj się z dokumentacją łącznika programu Hive.
5 InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call. Ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej do zespołu usługi Azure HDInsight.
6 InternalServerError - ObjectDisposedException występuje w kodzie RP. Ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej do zespołu usługi Azure HDInsight.
7 PreconditionFailed — Niepowodzenie operacji z powodu limitów przydziału w subskrypcji użytkownika. Przed utworzeniem klastra następuje walidacja limitu przydziału. Jednak po utworzeniu kilku klastrów w ramach tej samej subskrypcji w tym samym czasie możliwe jest, że pierwszy klaster zajmuje limit przydziału, a drugi kończy się niepowodzeniem z powodu niedoboru przydziału. Upewnij się, że jest wystarczający limit przydziału i spróbuj ponownie utworzyć klaster/pulę klastrów.
8 ReconcileApplicationSecurityGroupError — Wewnętrzny błąd usługi AKS Ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej do zespołu usługi Azure HDInsight.
9 ResourceGroupBeingDeleted Podczas tworzenia lub aktualizowania zasobów usługi AKS w usłudze HDI użytkownik usuwa również niektóre zasoby w powiązanych grupach zasobów. Nie usuwaj zasobów w grupach zasobów powiązanych z usługą HDI, gdy są tworzone lub aktualizowane zasoby usługi HDI w usłudze AKS.
10 UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out. Problem z usługą AKS — może być spowodowany dużym ruchem w określonym regionie w czasie operacji. Spróbuj ponownie wykonać operację po pewnym czasie. Jeśli to możliwe, użyj innego regionu.
11 Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} Zasada usługi 1-p nie jest dołączona do dzierżawy. Wykonaj polecenie , aby aprowizować zasadę usługi 1-p w nowej dzierżawie do dołączenia.
12 NotFound - ARM/AKS sdk error Użytkownik próbuje zaktualizować usługę HDI w klastrze usługi AKS, ale odpowiednia pula agentów została usunięta. Odpowiednia pula agentów została usunięta. Nie zaleca się bezpośredniego działania puli agentów usługi AKS.
13 AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi Brak uprawnień do wykonania operacji. Sprawdź, czy identyfikator aplikacji jednostki usługi wymieniony w komunikacie o błędzie należącym do Ciebie. Jeśli tak, przyznaj uprawnienie zgodnie z komunikatem o błędzie. Jeśli nie, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
14 DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespace failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} Rp został nieoczekiwanie przełączony do nowego wystąpienia roli. ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
15 EntityStoreOperationError - ARM/AKS sdk error Operacja bazy danych nie powiodła się po stronie usługi AKS podczas aktualizacji klastra. Spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
16 InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} Ten błąd został spowodowany różnymi problemami. ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
17 InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} Ten błąd został spowodowany różnymi problemami. spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
18 InternalServerError - Null reference exception occurs in RP code. Ten błąd został spowodowany różnymi problemami. Ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej do zespołu usługi Azure HDInsight.
19 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} Ten błąd został spowodowany różnymi problemami. ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
20 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} Ten błąd został spowodowany różnymi problemami. ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
21 OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. Trwa inna operacja puli agentów (skalowanie). Ten błąd został spowodowany ponownym uruchomieniem usługi Service Fabric przez dostawcę usług. Poczekaj na zakończenie poprzedniej operacji przed rozpoczęciem nowej operacji. Jeśli problem będzie się powtarzać po ponowieniu próby, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
22 ReconcileVMSSAgentPoolFailed Przed utworzeniem klastra następuje walidacja limitu przydziału. Jednak po utworzeniu kilku klastrów w ramach tej samej subskrypcji w tym samym czasie możliwe jest, że pierwszy klaster zajmuje limit przydziału, a inne kończą się niepowodzeniem z powodu niedoboru przydziału. Upewnij się, że jest wystarczający limit przydziału i spróbuj ponownie utworzyć klaster/pulę klastrów.
23 ReconcileVMSSAgentPoolFailed - Nie można ustanowić połączenia wychodzącego z agentów AKS/VMSS problem po stronie: maszyna wirtualna zgłosiła błąd. spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
24 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} Ten błąd został spowodowany przejściowym problemem z połączeniem SQL. spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
25 NotLatestOperation - ARM/AKS SDK error Nie można kontynuować operacji. Operacja została wywłaszona przez inną operację lub nie można zapisać informacji wymaganych przez operację (lub nie została jeszcze zapisana). spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
26 ReconcileVMSSAgentPoolFailed - Agent pool drain failed Wystąpił problem z operacją skalowania w dół. Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
27 ResourceNotFound - ARM/AKS SDK error Ten problem z błędem występuje, gdy użytkownik usunął/usunął wymagany zasób. Upewnij się, że zasób wymieniony w komunikacie o błędzie istnieje, a następnie spróbuj ponownie wykonać operację. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
28 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.]. Inicjowanie HMS może upłynął limit czasu z powodu problemów związanych z programem SQL Server lub magazynem. Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
29 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.]. Ten błąd może wystąpić z powodu keyvault niedostępność lub niedostępność klucza tajnego. W niektórych rzadkich przypadkach ten błąd może być spowodowany wolniejszym inicjowaniem infrastruktury tożsamości zasobnika w węzłach klastra. Jeśli masz włączoną usługę Log Analytics, sprawdź dzienniki secretprovider-validate job , aby zidentyfikować przyczynę.ponów próbę wykonania operacji po pewnym czasie, jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
30 FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} Ten błąd może wystąpić z różnych powodów, takich jak problem z ściąganie obrazu, lub zasobniki kontrolera nie są gotowe lub problem z tożsamością usługi zarządzanej. spróbuj ponownie wykonać operację po pewnym czasie, jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
31 FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} Ten błąd może wystąpić z różnych powodów, takich jak problem z ściąganie obrazu, lub zasobniki kontrolera nie są gotowe lub problem z tożsamością usługi zarządzanej. spróbuj ponownie wykonać operację po pewnym czasie, jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
32 InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}'. Ten błąd może wystąpić, jeśli konfiguracja usługi składa się ze składników, które nie są dozwolone. Zweryfikuj składniki konfiguracji usługi i spróbuj ponownie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
33 InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies. Ten błąd może wystąpić z powodu braku działania usług HMS, SPARK,YARN. Ten błąd może być związany z magazynem. Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
34 WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
35 WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} Ten błąd może wystąpić z powodu braku działania usług HMS, SPARK,YARN. Ten błąd może być związany z magazynem. Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
36 InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value]. Ten błąd może wystąpić, gdy nieobsługiwane pliki są przekazywane w konfiguracji usług. Zweryfikuj składniki konfiguracji usługi i spróbuj ponownie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
37 InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." Nieprawidłowe parametry uwierzytelniania — lokalizacja magazynu jest niedostępna. Popraw parametry uwierzytelniania i spróbuj ponownie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
38 InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.]. Ten błąd może wystąpić, gdy zasoby tożsamości zasobnika trwa zbyt długo, aby rozpocząć pracę w węźle, gdy zasobnik HMS jest zaplanowany. spróbuj ponownie wykonać operację, jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.

Następne kroki