Udostępnij za pośrednictwem


Błędy tworzenia klastra w usłudze Azure HDInsight w usłudze AKS

Ważny

Usługa Azure HDInsight w usłudze AKS została wycofana 31 stycznia 2025 r. Dowiedz się więcej z tego ogłoszenia.

Aby uniknąć nagłego kończenia obciążeń, należy przeprowadzić migrację obciążeń do usługi Microsoft Fabric lub równoważnego produktu platformy Azure.

Ważny

Ta funkcja jest obecnie dostępna w wersji zapoznawczej. Dodatkowe warunki użytkowania platformy Microsoft Azure dla wersji zapoznawczych zawierają więcej warunków prawnych dotyczących funkcji Azure, które znajdują się w wersji beta, w wersji zapoznawczej lub w inny sposób nie zostały jeszcze wydane w wersji ogólnodostępnej. Aby uzyskać informacje na temat tej konkretnej wersji zapoznawczej, zobacz informacje o wersji zapoznawczej Azure HDInsight w AKS. W przypadku pytań lub sugestii dotyczących funkcji złóż wniosek w AskHDInsight z potrzebnymi szczegółami i obserwuj nas, aby uzyskać więcej informacji na temat społeczności Azure HDInsight.

W tym artykule opisano sposób rozwiązywania problemów i usuwania błędów, które mogą wystąpić podczas tworzenia usługi Azure HDInsight w klastrach usługi AKS.

Sr. Nr Komunikat o błędzie Przyczyna Rezolucja
1 Błąd wewnętrzny serwera Nierozpoznany błąd Ten błąd może wskazywać na nieprawidłowy używany szablon. Obecnie łączniki bazy danych są dozwolone tylko za pośrednictwem szablonu ARM. W związku z tym weryfikacja konfiguracji nie jest możliwa w szablonie.
2 InvalidClusterSpec — ServiceDependencyFailure — nieprawidłowa konfiguracja Maksymalna ilość pamięci na błąd węzła. Odnieś się do maksymalnych konfiguracji pamięci typów wartości właściwości.
3 Czas oczekiwania na gotowość zasobów klastra wygasł — usługa magazynu metadanych niezdatna Ten błąd może być spowodowany tym, że nazwa kontenera może zawierać tylko małe litery, cyfry i łączniki. Nazwa kontenera musi zaczynać się literą lub cyfrą. Każdy łącznik musi być poprzedzony znakiem nonhyphen. Nazwa musi również mieć długość od 3 do 63 znaków.
4 InvalidClusterSpec -Invalid w konfiguracji — ClusterUpsertActivity Błąd: Nieprawidłowa właściwość konfiguracji hive.metastore.uri: may not be null. Zapoznaj się z dokumentacją łącznika Hive.
5 InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call. Ponów próbę wykonania operacji lub zgłoś problem do zespołu wsparcia Azure HDInsight.
6 InternalServerError - ObjectDisposedException występuje w kodzie RP. Ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej do zespołu usługi Azure HDInsight.
7 PreconditionFailed — niepowodzenie operacji z powodu limitów przydziału w subskrypcji użytkownika. Przed utworzeniem klastra następuje walidacja limitu przydziału. Jednak po utworzeniu kilku klastrów w ramach tej samej subskrypcji w tym samym czasie możliwe jest, że pierwszy klaster zajmuje limit przydziału, a drugi kończy się niepowodzeniem z powodu niedoboru przydziału. Upewnij się, że jest wystarczający limit przydziału i spróbuj ponownie utworzyć klaster/pulę klastrów.
8 ReconcileApplicationSecurityGroupError — wewnętrzny błąd usługi AKS Spróbuj ponownie wykonać operację lub otwórz zgłoszenie do zespołu wsparcia usługi Azure HDInsight.
9 ResourceGroupBeingDeleted Podczas tworzenia lub aktualizowania zasobów usługi AKS w usłudze HDI użytkownik usuwa również niektóre zasoby w powiązanych grupach zasobów. Nie usuwaj zasobów w grupach zasobów powiązanych z usługą HDI, gdy są tworzone lub aktualizowane zasoby usługi HDI w usłudze AKS.
10 UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out. Problem z usługą AKS — może być spowodowany dużym ruchem w określonym regionie w czasie operacji. Spróbuj ponownie wykonać operację po pewnym czasie. Jeśli to możliwe, użyj innego regionu.
11 Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} Zasada usługi 1-p nie jest dołączona do dzierżawy. Wykonaj polecenie, aby aprowizować zasadę działania usługi 1-p w nowej dzierżawie w celu wdrożenia.
12 NotFound - ARM/AKS sdk error Użytkownik próbuje zaktualizować HDI na klastrze AKS, ale odpowiednia pula agentów została usunięta. Odpowiednia pula agentów została usunięta. Nie zaleca się bezpośredniego zarządzania pulą agentów usługi AKS.
13 AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi Brak uprawnień do wykonania operacji. Sprawdź, czy identyfikator aplikacji zasady usługi wymieniony w komunikacie o błędzie należy do Ciebie. Jeśli tak, przyznaj uprawnienie zgodnie z komunikatem o błędzie. Jeśli nie, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
14 DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespace failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} RP został nieoczekiwanie przełączony na nową instancję roli. ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
15 EntityStoreOperationError - ARM/AKS sdk error Operacja bazy danych nie powiodła się w AKS podczas aktualizacji klastra. Spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
16 InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} Ten błąd został spowodowany różnymi problemami. ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
17 InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} Ten błąd został spowodowany różnymi problemami. spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
18 InternalServerError - Null reference exception occurs in RP code. Ten błąd został spowodowany różnymi problemami. Ponów próbę wykonania operacji lub otwórz zgłoszenie do pomocy technicznej dla zespołu Azure HDInsight.
19 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} Ten błąd został spowodowany różnymi problemami. ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
20 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} Ten błąd został spowodowany różnymi problemami. ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
21 OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. Trwa inna operacja puli agentów (skalowanie). Ten błąd został spowodowany ponownym uruchomieniem RP Service Fabric. Poczekaj na zakończenie poprzedniej operacji przed rozpoczęciem nowej operacji. Jeśli problem będzie się powtarzać po ponowieniu próby, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
22 ReconcileVMSSAgentPoolFailed Przed utworzeniem klastra następuje walidacja limitu przydziału. Jednak po utworzeniu kilku klastrów w ramach tej samej subskrypcji w tym samym czasie możliwe jest, że pierwszy klaster zajmuje limit przydziału, a inne kończą się niepowodzeniem z powodu niedoboru przydziału. Upewnij się, że jest wystarczający limit przydziału i spróbuj ponownie utworzyć klaster/pulę klastrów.
23 ReconcileVMSSAgentPoolFailed — nie można ustanowić połączenia wychodzącego przez agentów AKS/VMSS problem po stronie: maszyna wirtualna zgłosiła błąd. spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
24 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} Ten błąd został spowodowany przejściowym problemem z połączeniem SQL. spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
25 NotLatestOperation - ARM/AKS SDK error Nie można kontynuować operacji. Operacja została przerwana przez inną operację lub informacje potrzebne do operacji nie udało się zapisać (lub jeszcze nie zostały zapisane). spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
26 ReconcileVMSSAgentPoolFailed - Agent pool drain failed Wystąpił problem z operacją skalowania w dół. Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
27 ResourceNotFound - ARM/AKS SDK error Ten problem z błędem występuje, gdy użytkownik usunął/usunął wymagany zasób. Upewnij się, że zasób wymieniony w komunikacie o błędzie istnieje, a następnie spróbuj ponownie wykonać operację. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
28 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.]. Inicjowanie usługi HMS może upłynąć limit czasu z powodu problemów związanych z serwerem SQL lub magazynem. Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
29 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.]. Ten błąd może wystąpić z powodu niedostępności keyvault lub braku klucza tajnego. W niektórych rzadkich przypadkach ten błąd może być spowodowany wolniejszym inicjowaniem infrastruktury tożsamości podu w węzłach klastra. Jeśli włączono usługę Log Analytics, sprawdź dzienniki secretprovider-validate job, aby zidentyfikować przyczynę.ponów próbę wykonania operacji po pewnym czasie, jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej do zespołu usługi Azure HDInsight.
30 FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} Ten błąd może wystąpić z różnych powodów, takich jak problem z pobieraniem obrazu, brak gotowości podów kontrolera lub problem z MSI. spróbuj ponownie wykonać operację po pewnym czasie, jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
31 FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} Ten błąd może wystąpić z różnych powodów, takich jak problem z pobieraniem obrazu, gdy zasobniki kontrolera nie są gotowe, lub problem z usługą zarządzaną MSI. spróbuj ponownie wykonać operację po pewnym czasie, jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
32 InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}'. Ten błąd może wystąpić, jeśli konfiguracja usługi składa się ze składników, które nie są dozwolone. Zweryfikuj składniki konfiguracji usługi i spróbuj ponownie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
33 InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies. Ten błąd może wystąpić z powodu braku działania usług HMS, SPARK,YARN. Ten błąd może być związany z magazynem. Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
34 WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
35 WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} Ten błąd może wystąpić z powodu braku działania usług HMS, SPARK,YARN. Ten błąd może być związany z magazynem. Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
36 InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value]. Ten błąd może wystąpić, gdy nieobsługiwane pliki są przekazywane w konfiguracji usług. Zweryfikuj składniki konfiguracji usługi i spróbuj ponownie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
37 InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." Nieprawidłowe parametry uwierzytelniania — lokalizacja magazynu jest niedostępna. Popraw parametry uwierzytelniania i spróbuj ponownie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.
38 InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.]. Ten błąd może wystąpić, gdy zasoby tożsamości poda zbyt długo się uruchamiają na węźle, gdy zaplanowano działanie poda HMS. spróbuj ponownie wykonać operację, jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight.

Następne kroki