次の方法で共有


AKS 上の Azure HDInsight でのクラスター作成エラー

大事な

AKS 上の Azure HDInsight は、2025 年 1 月 31 日に廃止されました。 この発表 を通じて、について詳しく知ることができます。

ワークロードの突然の終了を回避するには、ワークロードを Microsoft Fabric または同等の Azure 製品 に移行する必要があります。

大事な

この機能は現在プレビュー段階です。 Microsoft Azure プレビューの 追加使用条件 には、ベータ版、プレビュー版、または一般公開されていない Azure 機能に適用される、より多くの法的条件が含まれています。 この特定のプレビューの詳細については、AKS プレビュー情報 Azure HDInsightを参照してください。 ご質問や機能の提案については、詳細を記載してAskHDInsightにリクエストを送信してください。また、Azure HDInsight Communityをフォローして、最新情報を入手してください。

この記事では、AKS クラスターで Azure HDInsight を作成するときに発生する可能性があるエラーのトラブルシューティングと解決方法について説明します。

Sr. No エラーメッセージ 原因 解決
1 サーバー内部エラー 未認識のエラー このエラーは、正しくないテンプレートが使用されたことを示している可能性があります。 現時点では、データベース コネクタは ARM テンプレート経由でのみ許可されています。 そのため、テンプレートで構成の検証を行うことはできません。
2 InvalidClusterSpec - ServiceDependencyFailure - 無効な構成 ノードあたりの最大メモリ エラー。 プロパティ値の型最大メモリ構成を参照してください。
3 WaitingClusterResourcesReadyTimeOut - メタストアサービスが準備できていません このエラーは、コンテナー名に小文字、数字、ハイフンのみが含まれていることが原因である可能性があります。 コンテナー名は、文字または数字で始まる必要があります。 各ハイフンの前には、ハイフン以外の文字を付ける必要があります。 また、名前の長さは 3 ~ 63 文字にする必要があります。
4 InvalidClusterSpec -Invalid 構成 - ClusterUpsertActivity エラー: 構成プロパティ hive.metastore.uri: may not be nullが無効です。 Hive コネクタのドキュメントを参照してください。
5 InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call. 操作を再試行するか、Azure HDInsight チームへのサポート チケットを開きます。
6 InternalServerError - ObjectDisposedException は RP コードで発生します。 操作を再試行するか、Azure HDInsight チームへのサポート チケットを開きます。
7 PreconditionFailed - ユーザー サブスクリプションのクォータ制限による操作エラー。 クラスターを作成する前にクォータの検証があります。 ただし、複数のクラスターが同じサブスクリプションで同時に作成されると、最初のクラスターがクォータを占有し、もう 1 つのクラスターがクォータ不足のために失敗する可能性があります。 十分なクォータがあることを確認し、クラスター/クラスター プールの作成を再試行します。
8 ReconcileApplicationSecurityGroupError - 内部 AKS エラー 操作を再試行するか、Azure HDInsight チームへのサポート チケットを開きます。
9 ResourceGroupBeingDeleted AKS リソースの作成または更新時に、ユーザーは関連するリソース グループ内の一部のリソースも削除します。 AKS リソースの HDI が作成または更新されるときに、HDI 関連のリソース グループ内のリソースを削除しないでください。
10 UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out. AKS の問題 - 操作時に特定のリージョンのトラフィックが多い可能性があります。 しばらくしてから操作を再試行してください。 可能であれば、別のリージョンを使用します。
11 Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} 1-p サービスの原則は、テナントに導入されていません。 このコマンドを実行して、オンボードする新しいテナントに 1-p サービス プリンシパルをプロビジョニングします。
12 NotFound - ARM/AKS sdk error ユーザーは AKS クラスターで HDI を更新しようとしますが、対応するエージェント プールが削除されました。 対応するエージェント プールが削除されました。 AKS エージェント プールを直接操作することはお勧めしません。
13 AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi 操作を実行するためのアクセス許可がありません。 エラーメッセージに記載されたサービス プリンシパル アプリ ID が自分のものであるかを確認してください。 "はい" の場合は、エラー メッセージに従ってアクセス許可を付与します。 ない場合は、Azure HDInsight チームへのサポート チケットを開きます。
14 DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespace failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} RP が予期せず新しいロール インスタンスに切り替えました。 操作を再試行するか、Azure HDInsight チームへのサポート チケットを開きます。
15 EntityStoreOperationError - ARM/AKS sdk error クラスターの更新中に AKS 側でデータベース操作が失敗しました。 しばらくしてから操作を再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。
16 InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} このエラーは、さまざまな問題が原因で発生しました。 操作を再試行するか、Azure HDInsight チームへのサポート チケットを開きます。
17 InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} このエラーは、さまざまな問題が原因で発生しました。 しばらくしてから操作を再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。
18 InternalServerError - Null reference exception occurs in RP code. このエラーは、さまざまな問題が原因で発生しました。 操作を再試行するか、Azure HDInsight チームへのサポート チケットを開きます。
19 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} このエラーは、さまざまな問題が原因で発生しました。 操作を再試行するか、Azure HDInsight チームへのサポート チケットを開きます。
20 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} このエラーは、さまざまな問題が原因で発生しました。 操作を再試行するか、Azure HDInsight チームへのサポート チケットを開きます。
21 OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. 別のエージェント プール操作 (スケーリング) が進行中です。 このエラーは、RP Service Fabric の再起動が原因で発生しました。 前の操作が完了するまで待ってから、新しい操作を開始します。 再試行後も問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。
22 ReconcileVMSSAgentPoolFailed クラスターを作成する前にクォータの検証があります。 ただし、複数のクラスターが同じサブスクリプションで同時に作成されると、最初のクラスターがクォータを占有し、他のクラスターがクォータ不足のために失敗する可能性があります。 十分なクォータがあることを確認し、クラスター/クラスター プールの作成を再試行します。
23 ReconcileVMSSAgentPoolFailed - エージェントからの送信接続を確立できません AKS/VMSS 側の問題: VM がエラーを報告しました。 しばらくしてから操作を再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。
24 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} このエラーは、SQL 接続の一時的な問題が原因で発生しました。 しばらくしてから操作を再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。
25 NotLatestOperation - ARM/AKS SDK error 操作を続行できません。 操作が別の操作によって割り込まれているか、操作に必要な情報を保存できませんでした (またはまだ保存されていません)。 しばらくしてから操作を再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。
26 ReconcileVMSSAgentPoolFailed - Agent pool drain failed スケールダウン操作に問題が発生しました。 Azure HDInsight チームへのサポート チケットを開きます。
二十七 ResourceNotFound - ARM/AKS SDK error このエラーの問題は、必要なリソースがユーザーによって削除または削除されたときに発生します。 エラー メッセージに記載されているリソースが存在することを確認してから、操作を再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。
28 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.]. SQL サーバーまたはストレージ関連の問題により、HMS の初期化がタイムアウトになる可能性があります。 Azure HDInsight チームへのサポート チケットを開きます。
29 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.]. このエラーは、keyvault にアクセスできないか、秘密鍵が使用できないことが原因で発生する可能性があります。 まれに、このエラーは、クラスター ノードでのポッド ID インフラストラクチャの初期化が遅くなっていることが原因である可能性があります。 Log Analytics を有効にしている場合は、secretprovider-validate job のログを確認して理由を特定します。しばらくしてから操作を再試行してください。問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。
30 FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} このエラーは、イメージ プルの問題、コントローラー ポッドの準備ができていない、MSI の問題など、さまざまな理由で発生する可能性があります。 しばらくしてから操作を再試行してください。問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。
31 FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} このエラーは、イメージ プルの問題、コントローラー ポッドの準備ができていない、MSI の問題など、さまざまな理由で発生する可能性があります。 しばらくしてから操作を再試行してください。問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。
32 InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}'. このエラーは、サービス構成が許可されていないコンポーネントで構成されている場合に発生する可能性があります。 サービス構成コンポーネントを検証し、再試行します。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。
33 InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies. このエラーは、HMS、SPARK、YARN サービスが稼働していないために発生する可能性があります。このエラーはストレージに関連している可能性があります。 Azure HDInsight チームへのサポート チケットを開きます。
34 WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. Azure HDInsight チームへのサポート チケットを開きます。
35 WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} このエラーは、HMS、SPARK、YARN サービスが稼働していないために発生する可能性があります。このエラーはストレージに関連している可能性があります。 Azure HDInsight チームへのサポート チケットを開きます。
36 InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value]. このエラーは、サポートされていないファイルがサービス構成で渡されるときに発生する可能性があります。 サービス構成コンポーネントを検証し、再試行します。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。
37 InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." 認証パラメーターが無効です。ストレージの場所にアクセスできません。 認証パラメーターを修正し、再試行します。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。
38 InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.]. このエラーは、HMS ポッドがスケジュールされているときに、ポッド ID リソースがノードで開始するのに時間がかかりすぎる場合に発生する可能性があります。 操作を再試行してください。問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを開きます。

次の手順