AKS 上の HDInsight 上の Apache Flink アプリケーションモードクラスター

[アーティクル]
09/20/2024

大事な

AKS 上の Azure HDInsight は、2025 年 1 月 31 日に廃止されました。この発表でについて詳しく学びましょう。

ワークロードの突然の終了を回避するには、ワークロードを Microsoft Fabric または同等の Azure 製品に移行する必要があります。

大事な

この機能は現在プレビュー段階です。 Microsoft Azure プレビューの追加使用条件には、ベータ版、プレビュー版、または一般公開されていない Azure 機能に適用される、より多くの法的条件が含まれています。この特定のプレビューの詳細については、AKS プレビュー情報 Azure HDInsightを参照してください。ご質問や機能の提案については、AskHDInsight に詳細を記載して送信し、Azure HDInsight Community をフォローしてさらなる更新情報をご確認ください。

AKS 上の HDInsight では、Flink アプリケーションモードクラスターが提供されるようになりました。このクラスターを使用すると、使いやすいインターフェイスと Azure Resource Management Rest API を使用して、Azure portal を使用してクラスター Flink アプリケーションモードのライフサイクルを管理できます。アプリケーションモードクラスターは、専用リソースを使用して大規模で実行時間の長いジョブをサポートし、リソース集中型または広範なデータ処理タスクを処理するように設計されています。

このデプロイモードを使用すると、特定の Flink アプリケーションに専用リソースを割り当て、大規模なワークロードを効率的に処理するのに十分なコンピューティング能力とメモリを確保できます。 

利点

ジョブ jar を使用してクラスターのデプロイを簡略化しました。
ユーザーフレンドリ REST API: AKS 上の HDInsight には、Update、Savepoint、Cancel、Delete などのアプリモードジョブ操作を管理するためのわかりやすい ARM Rest API が用意されています。
ジョブの更新と状態管理の管理が簡単: ネイティブの Azure portal 統合により、ジョブを更新し、最後に保存した状態 (セーブポイント) に復元するための手間のかからないエクスペリエンスが提供されます。この機能により、ジョブのライフサイクル全体にわたって継続性とデータの整合性が確保されます。
Azure Pipelines またはその他の CI/CD ツールを使用して Flink ジョブを自動化する: AKS 上の HDInsight を使用すると、Flink ユーザーはわかりやすい ARM Rest API にアクセスでき、Flink ジョブ操作を Azure Pipeline やその他の CI/CD ツールにシームレスに統合できます。

主な機能

セーブポイントを使用してジョブを停止および開始する: ユーザーは、以前の状態 (Savepoint) から Flink AppMode ジョブを正常に停止して開始できます。セーブポイントを使用すると、ジョブの進行状況が確実に維持され、シームレスな再開が可能です。
ジョブの更新: ユーザーは、ストレージアカウントの jar を更新した後、実行中の AppMode ジョブを更新できます。この更新では、セーブポイントが自動的に取得され、新しい jar で AppMode ジョブが開始されます。
ステートレス更新: AppMode ジョブの新しい再起動の実行は、ステートレス更新によって簡略化されます。この機能により、ユーザーは更新されたジョブ jar を使用してクリーンな再起動を開始できます。
セーブポイント管理: ユーザーはいつでも、実行中のジョブのセーブポイントを作成できます。これらのセーブポイントを一覧表示し、必要に応じて特定のチェックポイントからジョブを再開するために使用できます。
キャンセル: ジョブを完全に取り消します。
の削除: AppMode クラスターを削除します。

Flink アプリケーションクラスターを作成する方法

前提条件

次のセクションの前提条件を満たす:

サブスクリプションの前提条件。
リソースの前提条件。
クラスタープールを作成します。
ストレージアカウントにジョブジャーを追加する。

Flink アプリモードクラスターを設定する前に、いくつかの準備手順が必要です。これらの手順の 1 つは、クラスターのストレージアカウントにアプリモードジョブ JAR を配置することです。
アプリモードジョブ JAR 用のディレクトリを作成します。

専用コンテナー内に、アプリモードジョブ JAR ファイルをアップロードするディレクトリを作成します。このディレクトリは、Flink クラスターまたはジョブのクラスパスに含める JAR ファイルを格納する場所として機能します。
Savepoints ディレクトリ (省略可能):

ユーザーがジョブの実行中にセーブポイントを取得する場合は、これらのセーブポイントを格納するための別のディレクトリをストレージアカウント内に作成します。このディレクトリは、セーブポイントのチェックポイントデータとメタデータを格納するために使用されます。
ディレクトリ構造の例:

Flink アプリモードクラスターを作成する

Flink AppMode クラスターは、クラスタープールのデプロイが完了したら作成できます。既存のクラスタープールの使用を開始する場合の手順を確認します。

Azure portal で、「AKS の HDInsight クラスタープール/HDInsight/HDInsight」と入力し、AKS クラスタープール上の Azure HDInsight を選択してクラスタープールページに移動します。 AKS クラスタープールの HDInsight ページで、新しい Flink クラスターを作成するクラスタープールを選択します。

特定のクラスタープールページで、[+ 新しいクラスター] をクリックし、次の情報を入力します。

財産	説明
予約	このフィールドには、クラスタープールに登録された Azure サブスクリプションが自動的に入力されます。
リソースグループ	このフィールドは、クラスタープール上のリソースグループを自動的に設定して表示します。
地域	このフィールドは、クラスタープールで選択されたリージョンを自動的に設定して表示します。
クラスタープール	このフィールドは自動入力され、現在クラスターが作成されているクラスタープール名を表示します。別のプールにクラスターを作成するには、ポータルでクラスタープールを見つけて、[+ 新しいクラスター] をクリックします。
HDInsight on AKS のプールバージョン	このフィールドには、現在クラスターが作成中のクラスタープールのバージョンが自動入力されて表示されます。
AKS バージョンの HDInsight	新しいクラスターの AKS 上の HDInsight のマイナーバージョンまたはパッチバージョンを選択します。
クラスターの種類	ドロップダウンリストから Flink を選択します。
クラスター名	新しいクラスターの名前を入力します。
ユーザー割り当てマネージド ID	ドロップダウンリストから、クラスターで使用するマネージド ID を選択します。マネージドサービス ID (MSI) の所有者であり、MSI にクラスターのマネージド ID オペレーターロールがない場合は、ボックスの下のリンクをクリックして、AKS エージェントプール MSI から必要なアクセス許可を割り当てます。 MSI に既に適切なアクセス許可がある場合、リンクは表示されません。 MSI に必要な他のロールの割り当ての前提条件を参照してください。
ストレージアカウント	ドロップダウンリストから、Flink クラスターに関連付けるストレージアカウントを選択し、コンテナー名を指定します。マネージド ID には、クラスターの作成時に "ストレージ BLOB データ所有者" ロールを使用して、指定されたストレージアカウントへのアクセス権がさらに付与されます。
仮想ネットワーク	クラスターの仮想ネットワーク。
サブネット	クラスターの仮想サブネット。

Flink SQL の Hive カタログの有効化:

財産	説明
Hive カタログを使用する	外部 Hive メタストアを使用するには、このオプションを有効にします。
Hive向けのSQLデータベース	ドロップダウンリストから、hive-metastore テーブルを追加する SQL Database を選択します。
SQL 管理者ユーザー名	SQL Server 管理者のユーザー名を入力します。このアカウントは、メタストアが SQL データベースと通信するために使用されます。
キーボールト	ドロップダウンリストから、SQL Server 管理者ユーザー名のパスワードを含むシークレットを含む Key Vault を選択します。クラスターの作成に使用されている MSI に対するキーのアクセス許可、シークレットのアクセス許可、証明書のアクセス許可など、必要なすべてのアクセス許可を持つアクセスポリシーを設定する必要があります。 MSI には Key Vault 管理者ロールが必要です。 IAM を使用して必要なアクセス許可を追加します。
SQL パスワードシークレット名	SQL データベースのパスワードが格納されている Key Vault のシークレット名を入力します。

手記

既定では、Hive カタログには、クラスターの作成時に使用されるストレージアカウントとコンテナーと同じストレージアカウントが使用されます。

[次へ: 構成] を選択して続行します。

[構成] ページで、次の情報を入力します。

財産	説明
ノードサイズ	ヘッドノードとワーカーノードの両方の Flink ノードに使用するノードサイズを選択します。
ノードの数	Flink クラスターのノード数を選択します。既定では、ヘッドノードは 2 です。ワーカーノードのサイズ設定は、Flink のタスクマネージャーの構成を決定するのに役立ちます。ジョブマネージャーと履歴サーバーはヘッドノード上にあります。

[展開] セクションで、アプリケーションモード 展開の種類を選択、次の情報を指定します。

財産	説明
Jar パス	ジョブ jar の ABFS (ストレージ) パスを指定します。たとえば、`abfs://flink@teststorage.dfs.core.windows.net/appmode/job.jar`
エントリクラス (省略可能)	アプリケーションモードクラスターのメインクラス。例: com.microsoft.testjob
引数 (省略可能)	あなたのジョブのメインクラスの引数。
保存ポイント名	ジョブの起動に使用する古いセーブポイントの名前
アップグレードモード	既定のアップグレードオプションを選択します。このオプションは、クラスターでメジャーバージョンのアップグレードが行われている場合に使用されます。使用できるオプションは 3 つあります。 UPDATE: アップグレード後にユーザーが最後のセーブポイントから回復する場合に使用されます。 STATELESS_UPDATE: アップグレード後にユーザーがジョブを新たに再起動する場合に使用されます。 LAST_STATE_UPDATE: アップグレード後にユーザーが最後のチェックポイントからジョブを回復する場合に使用されます
Flink ジョブの構成	Flink ジョブに必要な構成をさらに追加します。

[ジョブログの集計] を選択します。ジョブログをリモートストレージにアップロードする場合は、チェックボックスをオンにします。ジョブ問題のデバッグに役立ちます。ジョブログの既定の場所は "StorageAccount/Container/DeploymentId/logs" です。 "pipeline.remote.log.dir" を構成することで、既定のログディレクトリを変更できます。ログ収集の既定の間隔は 600 秒です。ユーザーは、"pipeline.log.aggregation.interval" を構成することで変更できます。

[サービス構成] セクションで、次の情報を指定します。

財産	説明
タスクマネージャーの CPU	整数。タスクマネージャーの CPU のサイズを (コア単位で) 入力します。
タスクマネージャーのメモリ (MB 単位)	タスクマネージャーのメモリサイズを MB 単位で入力します。最小 1,800 MB。
ジョブマネージャーの CPU	整数。ジョブマネージャーの CPU の数を (コア単位で) 入力します。
ジョブマネージャーのメモリ (MB)	メモリサイズを MB 単位で入力します。最小 1,800 MB。
履歴サーバーの CPU	整数。ジョブマネージャーの CPU の数を (コア単位で) 入力します。
履歴サーバーのメモリ (MB)	メモリサイズを MB 単位で入力します。最小 1,800 MB。

[次へ: 統合] ボタンをクリックして、次のページに進みます。

[統合] ページで、次の情報を指定します。

財産	説明
ログ分析	この機能は、クラスタープールに関連付けられている Log Analytics ワークスペースでログ収集を有効にした後に選択できる場合にのみ使用できます。
Azure Prometheus	この機能は、Azure Monitor ワークスペースにメトリックとログを送信して、クラスター内の Insights とログを直接表示することです。

[次へ: タグ] ボタンをクリックして、次のページに進みます。

[タグ] ページで、次の情報を指定します。

財産	説明
名前	随意。クラスターリソースに関連付けられているすべてのリソースを簡単に識別するために、AKS の HDInsight などの名前を入力します。
価値	これは空白のままにしておくことができます。
資源	選択したすべてのリソースを選択します。

[次へ: 確認と作成] を選択して続行します。
[確認と作成] ページで、ページの上部にある 検証に成功した メッセージを探し、[作成] をクリックします。

進行中のデプロイページが表示され、クラスターが作成されます。クラスターの作成には 5 ~ 10 分かかります。クラスターが作成されると、"デプロイが完了しました" というメッセージが表示されます。ページから離れた場合は、通知で現在の状態を確認できます。

ポータルからアプリケーションジョブを管理する

HDInsight AKS には、Flink ジョブを管理する方法が用意されています。失敗したジョブを再起動できます。ポータルからジョブを再起動します。

ポータルから Flink ジョブを実行するには、次の場所に移動します。

ポータル > HDInsight を AKS クラスタープール > Flink クラスター > 設定 > Flink ジョブ。

停止: ジョブの停止にパラメーターは必要ありませんでした。ユーザーは、アクションを選択してジョブを停止できます。ジョブが停止すると、ポータルのジョブステータスが「停止済み」に変更されます。
開始: セーブポイントからジョブを開始します。ジョブを開始するには、停止したジョブを選択して開始します。
更新: 更新は、更新されたジョブコードを使用してジョブを再開するのに役立ちます。ユーザーは、ストレージの場所で最新のジョブ jar を更新し、ポータルからジョブを更新する必要があります。このアクションは、セーブポイントを使用してジョブを停止し、最新の jar で再開します。
ステートレス更新: ステートレスは更新に似ていますが、最新のコードでジョブを新たに再起動する必要があります。ジョブが更新されると、ポータル上のジョブの状態が [実行中] として表示されます。
セーブポイント: Flink ジョブのセーブポイントを取得します。
キャンセル: ジョブを終了させる。
削除: AppMode クラスターを削除します。
ジョブの詳細の表示: ジョブの詳細を表示するには、ユーザーがジョブ名をクリックすると、ジョブと最後のアクションの結果に関する詳細が表示されます。

失敗したアクションの場合、この json ビューには、エラーの詳細な例外と理由が表示されます。

次の方法で共有

AKS 上の HDInsight 上の Apache Flink アプリケーションモードクラスター

利点

主な機能

Flink アプリケーションクラスターを作成する方法

前提条件

Flink アプリモードクラスターを作成する

ポータルからアプリケーションジョブを管理する

その他のリソース

次の方法で共有

AKS 上の HDInsight 上の Apache Flink アプリケーション モード クラスター

利点

主な機能

Flink アプリケーション クラスターを作成する方法

前提 条件

Flink アプリ モード クラスターを作成する

ポータルからアプリケーション ジョブを管理する

その他のリソース

AKS 上の HDInsight 上の Apache Flink アプリケーションモードクラスター

Flink アプリケーションクラスターを作成する方法

前提条件

Flink アプリモードクラスターを作成する

ポータルからアプリケーションジョブを管理する