Błędy tworzenia klastra w usłudze Azure HDInsight w usłudze AKS
Ważny
Usługa Azure HDInsight w usłudze AKS została wycofana 31 stycznia 2025 r. Dowiedz się więcej z tego ogłoszenia.
Aby uniknąć nagłego kończenia obciążeń, należy przeprowadzić migrację obciążeń do usługi Microsoft Fabric lub równoważnego produktu platformy Azure.
Ważny
Ta funkcja jest obecnie dostępna w wersji zapoznawczej. Dodatkowe warunki użytkowania platformy Microsoft Azure dla wersji zapoznawczych zawierają więcej warunków prawnych dotyczących funkcji Azure, które znajdują się w wersji beta, w wersji zapoznawczej lub w inny sposób nie zostały jeszcze wydane w wersji ogólnodostępnej. Aby uzyskać informacje na temat tej konkretnej wersji zapoznawczej, zobacz informacje o wersji zapoznawczej Azure HDInsight w AKS. W przypadku pytań lub sugestii dotyczących funkcji złóż wniosek w AskHDInsight z potrzebnymi szczegółami i obserwuj nas, aby uzyskać więcej informacji na temat społeczności Azure HDInsight.
W tym artykule opisano sposób rozwiązywania problemów i usuwania błędów, które mogą wystąpić podczas tworzenia usługi Azure HDInsight w klastrach usługi AKS.
Sr. Nr | Komunikat o błędzie | Przyczyna | Rezolucja |
---|---|---|---|
1 | Błąd wewnętrzny serwera Nierozpoznany błąd | Ten błąd może wskazywać na nieprawidłowy używany szablon. Obecnie łączniki bazy danych są dozwolone tylko za pośrednictwem szablonu ARM. W związku z tym weryfikacja konfiguracji nie jest możliwa w szablonie. | |
2 | InvalidClusterSpec — ServiceDependencyFailure — nieprawidłowa konfiguracja | Maksymalna ilość pamięci na błąd węzła. | Odnieś się do maksymalnych konfiguracji pamięci typów wartości właściwości. |
3 | Czas oczekiwania na gotowość zasobów klastra wygasł — usługa magazynu metadanych niezdatna | Ten błąd może być spowodowany tym, że nazwa kontenera może zawierać tylko małe litery, cyfry i łączniki. Nazwa kontenera musi zaczynać się literą lub cyfrą. | Każdy łącznik musi być poprzedzony znakiem nonhyphen. Nazwa musi również mieć długość od 3 do 63 znaków. |
4 | InvalidClusterSpec -Invalid w konfiguracji — ClusterUpsertActivity | Błąd: Nieprawidłowa właściwość konfiguracji hive.metastore.uri: may not be null . |
Zapoznaj się z dokumentacją łącznika Hive. |
5 |
InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call . |
Ponów próbę wykonania operacji lub zgłoś problem do zespołu wsparcia Azure HDInsight. | |
6 |
InternalServerError - ObjectDisposedException występuje w kodzie RP. |
Ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej do zespołu usługi Azure HDInsight. | |
7 |
PreconditionFailed — niepowodzenie operacji z powodu limitów przydziału w subskrypcji użytkownika. |
Przed utworzeniem klastra następuje walidacja limitu przydziału. Jednak po utworzeniu kilku klastrów w ramach tej samej subskrypcji w tym samym czasie możliwe jest, że pierwszy klaster zajmuje limit przydziału, a drugi kończy się niepowodzeniem z powodu niedoboru przydziału. | Upewnij się, że jest wystarczający limit przydziału i spróbuj ponownie utworzyć klaster/pulę klastrów. |
8 |
ReconcileApplicationSecurityGroupError — wewnętrzny błąd usługi AKS |
Spróbuj ponownie wykonać operację lub otwórz zgłoszenie do zespołu wsparcia usługi Azure HDInsight. | |
9 | ResourceGroupBeingDeleted |
Podczas tworzenia lub aktualizowania zasobów usługi AKS w usłudze HDI użytkownik usuwa również niektóre zasoby w powiązanych grupach zasobów. | Nie usuwaj zasobów w grupach zasobów powiązanych z usługą HDI, gdy są tworzone lub aktualizowane zasoby usługi HDI w usłudze AKS. |
10 |
UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out . |
Problem z usługą AKS — może być spowodowany dużym ruchem w określonym regionie w czasie operacji. | Spróbuj ponownie wykonać operację po pewnym czasie. Jeśli to możliwe, użyj innego regionu. |
11 | Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} |
Zasada usługi 1-p nie jest dołączona do dzierżawy. | Wykonaj polecenie, aby aprowizować zasadę działania usługi 1-p w nowej dzierżawie w celu wdrożenia. |
12 | NotFound - ARM/AKS sdk error |
Użytkownik próbuje zaktualizować HDI na klastrze AKS, ale odpowiednia pula agentów została usunięta. | Odpowiednia pula agentów została usunięta. Nie zaleca się bezpośredniego zarządzania pulą agentów usługi AKS. |
13 | AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi |
Brak uprawnień do wykonania operacji. | Sprawdź, czy identyfikator aplikacji zasady usługi wymieniony w komunikacie o błędzie należy do Ciebie. Jeśli tak, przyznaj uprawnienie zgodnie z komunikatem o błędzie. Jeśli nie, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
14 | DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespace failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} |
RP został nieoczekiwanie przełączony na nową instancję roli. | ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
15 | EntityStoreOperationError - ARM/AKS sdk error |
Operacja bazy danych nie powiodła się w AKS podczas aktualizacji klastra. | Spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
16 | InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} |
Ten błąd został spowodowany różnymi problemami. | ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
17 | InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} |
Ten błąd został spowodowany różnymi problemami. | spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
18 |
InternalServerError - Null reference exception occurs in RP code . |
Ten błąd został spowodowany różnymi problemami. | Ponów próbę wykonania operacji lub otwórz zgłoszenie do pomocy technicznej dla zespołu Azure HDInsight. |
19 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} |
Ten błąd został spowodowany różnymi problemami. | ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
20 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} |
Ten błąd został spowodowany różnymi problemami. | ponów próbę wykonania operacji lub otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
21 | OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. |
Trwa inna operacja puli agentów (skalowanie). Ten błąd został spowodowany ponownym uruchomieniem RP Service Fabric. | Poczekaj na zakończenie poprzedniej operacji przed rozpoczęciem nowej operacji. Jeśli problem będzie się powtarzać po ponowieniu próby, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
22 | ReconcileVMSSAgentPoolFailed |
Przed utworzeniem klastra następuje walidacja limitu przydziału. Jednak po utworzeniu kilku klastrów w ramach tej samej subskrypcji w tym samym czasie możliwe jest, że pierwszy klaster zajmuje limit przydziału, a inne kończą się niepowodzeniem z powodu niedoboru przydziału. | Upewnij się, że jest wystarczający limit przydziału i spróbuj ponownie utworzyć klaster/pulę klastrów. |
23 |
ReconcileVMSSAgentPoolFailed — nie można ustanowić połączenia wychodzącego przez agentów |
AKS/VMSS problem po stronie: maszyna wirtualna zgłosiła błąd. |
spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
24 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} |
Ten błąd został spowodowany przejściowym problemem z połączeniem SQL. | spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
25 | NotLatestOperation - ARM/AKS SDK error |
Nie można kontynuować operacji. Operacja została przerwana przez inną operację lub informacje potrzebne do operacji nie udało się zapisać (lub jeszcze nie zostały zapisane). | spróbuj ponownie wykonać operację po pewnym czasie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
26 | ReconcileVMSSAgentPoolFailed - Agent pool drain failed |
Wystąpił problem z operacją skalowania w dół. | Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
27 | ResourceNotFound - ARM/AKS SDK error |
Ten problem z błędem występuje, gdy użytkownik usunął/usunął wymagany zasób. | Upewnij się, że zasób wymieniony w komunikacie o błędzie istnieje, a następnie spróbuj ponownie wykonać operację. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
28 |
InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.] . |
Inicjowanie usługi HMS może upłynąć limit czasu z powodu problemów związanych z serwerem SQL lub magazynem. | Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
29 |
InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.] . |
Ten błąd może wystąpić z powodu niedostępności keyvault lub braku klucza tajnego. W niektórych rzadkich przypadkach ten błąd może być spowodowany wolniejszym inicjowaniem infrastruktury tożsamości podu w węzłach klastra. |
Jeśli włączono usługę Log Analytics, sprawdź dzienniki secretprovider-validate job , aby zidentyfikować przyczynę.ponów próbę wykonania operacji po pewnym czasie, jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej do zespołu usługi Azure HDInsight. |
30 | FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} |
Ten błąd może wystąpić z różnych powodów, takich jak problem z pobieraniem obrazu, brak gotowości podów kontrolera lub problem z MSI. | spróbuj ponownie wykonać operację po pewnym czasie, jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
31 | FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} |
Ten błąd może wystąpić z różnych powodów, takich jak problem z pobieraniem obrazu, gdy zasobniki kontrolera nie są gotowe, lub problem z usługą zarządzaną MSI. | spróbuj ponownie wykonać operację po pewnym czasie, jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
32 |
InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}' . |
Ten błąd może wystąpić, jeśli konfiguracja usługi składa się ze składników, które nie są dozwolone. | Zweryfikuj składniki konfiguracji usługi i spróbuj ponownie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
33 |
InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies . |
Ten błąd może wystąpić z powodu braku działania usług HMS, SPARK,YARN. Ten błąd może być związany z magazynem. | Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
34 | WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. |
Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. | |
35 | WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} |
Ten błąd może wystąpić z powodu braku działania usług HMS, SPARK,YARN. Ten błąd może być związany z magazynem. | Otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
36 |
InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value] . |
Ten błąd może wystąpić, gdy nieobsługiwane pliki są przekazywane w konfiguracji usług. | Zweryfikuj składniki konfiguracji usługi i spróbuj ponownie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
37 | InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." |
Nieprawidłowe parametry uwierzytelniania — lokalizacja magazynu jest niedostępna. | Popraw parametry uwierzytelniania i spróbuj ponownie. Jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |
38 |
InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.] . |
Ten błąd może wystąpić, gdy zasoby tożsamości poda zbyt długo się uruchamiają na węźle, gdy zaplanowano działanie poda HMS. | spróbuj ponownie wykonać operację, jeśli problem będzie się powtarzać, otwórz bilet pomocy technicznej dla zespołu usługi Azure HDInsight. |