次の方法で共有


AKS 上の HDInsight - よく寄せられる質問

この記事では、AKS 上の Azure HDInsight に関するいくつかの一般的な質問について説明します。

大事な

AKS 上の Azure HDInsight は、2025 年 1 月 31 日に廃止されました。 詳しくはこの発表 を参照してください

ワークロードの突然の終了を回避するには、ワークロードを Microsoft Fabric または同等の Azure 製品 に移行する必要があります。

大事な

この機能は現在プレビュー段階です。 Microsoft Azure プレビューの 追加使用条件 には、ベータ版、プレビュー版、または一般公開されていない Azure 機能に適用される、より多くの法的条件が含まれています。 この特定のプレビューの詳細については、AKS プレビュー情報 Azure HDInsightを参照してください。 ご質問や機能の提案については、AskHDInsight に詳細を記載したリクエストを送信してください。また、最新の情報を得るには、Azure HDInsight Community をフォローしてください。

全般

  • AKS の HDInsight とは

    AKS 上の HDInsight は新しい HDInsight バージョンであり、Apache Flink (ストリーミング用)、Trino (アドホック分析と BI 用)、Apache Spark などの新しいオープンソース分析プロジェクトを備えたエンタープライズ対応のマネージド クラスター サービスを提供します。 詳細については、「概要」を参照してください。

  • AKS 上の HDInsight はどのようなクラスター図形をサポートしていますか?

    AKS 上の HDInsight では、最初に Trino、Apache Flink、Apache Spark がサポートされています。 ただし、Kafka、Hive などの他のクラスター図形はロードマップに含まれています。

  • AKS での HDInsight の使用を開始するにはどうすればよいですか?

    開始するには、Azure Marketplace にアクセスし、AKS サービスで Azure HDInsight を検索し、の開始方法参照してください。

  • VM 上の既存の HDInsight と現在実行しているクラスターはどうなりますか?

    既存の HDInsight (VM 上の HDInsight) に変更はありません。 既存のすべてのクラスターは引き続き実行され、新しい HDInsight クラスターの作成とスケーリングを続行できます。

  • AKS 上の HDInsight でサポートされているオペレーティング システムはどれですか?

    AKS 上の HDInsight は、マリナー OS に基づいています。 詳細については、OS バージョン 参照してください。

  • AKS 上の HDInsight はどのリージョンで利用できますか?

    サポートされているリージョンの一覧については、リージョンの可用性を参照してください。

  • AKS クラスターに HDInsight をデプロイするコストは何ですか?

    価格の詳細については、HDInsight on AKS の価格に関する記事を参照してください。

クラスター管理

  • 複数のクラスターを同時に実行できますか?

    はい。クラスター プールごとに必要な数のクラスターを同時に実行できます。 ただし、サブスクリプションのクォータによる制約がないことを確認してください。 クラスター プールで許可されるノードの最大数は 250 (パブリック プレビュー段階) です。

  • クラスターにプラグイン/ライブラリをインストールまたは追加できますか?

    はい。クラスターの図形に応じて、カスタム プラグインとライブラリをインストールできます。

  • クラスターに SSH 接続できますか?

    はい。webssh を使用してクラスターに SSH 接続し、クエリを実行し、そこから直接ジョブを送信できます。

Metastore

  • 外部メタストアを使用してクラスターに接続できますか?

    はい。外部メタストアを使用できます。 ただし、外部カスタム メタストアとしてサポートされるのは Azure SQL Database のみです。

  • 複数のクラスター間でメタストアを共有できますか?

    はい。AKS の複数の HDInsight 間でメタストアを共有できます。

  • サポートされている Hive メタストアのバージョンは何ですか?

    Hive メタストア バージョン 3.1.2

作業負荷

Trino

  • Trino とは

    Trino は、オープン ソースのフェデレーションおよび分散 SQL クエリ エンジンです。これにより、中央データ ウェアハウスに移動することなく、異なるデータ ソースに存在するデータに対してクエリを実行できます。 ANSI SQL を使用してデータのクエリを実行できます。新しい言語を学習する必要はありません。 詳細については、Trino の概要 参照してください。

  • どのようなコネクタをサポートしていますか?

    AKS Trino 上の HDInsight では、複数のコネクタがサポートされています。 詳細については、Trino コネクタの一覧を参照してください。 オープン ソース バージョンで新しいコネクタを使用できる場合と同様に、新しいコネクタを追加し続けます。

  • 既存のクラスターにカタログを追加できますか?

    はい。サポートされているカタログを既存のクラスターに追加できます。 詳細については、「既存のクラスターにカタログを追加する」を参照してください。

  • Apache Flink とは

    Apache Flink は、ストリーム処理と、無制限および有界データ ストリームに対してステートフルな計算を実行するためのクラス最高のオープン ソース分析エンジンです。 メモリ内の速度と任意のスケールで計算を実行できます。 AKS 上の HDInsight 上の Flink は、マネージド オープンソースの Apache Flink を提供します。 詳細については、Flink の概要 参照してください。

  • Apache Flink でセッション モードとアプリ モードの両方をサポートしていますか?

    AKS 上の HDInsight では、Flink は現在セッション モード クラスターをサポートしています。

  • AKS 上の HDInsight での状態バックエンド管理とそのしくみ

    バックエンドによって、状態が格納される場所が決まります。 チェックポイント処理がアクティブ化されると、データ損失を防ぐためにチェックポイント時に状態が保持され、一貫して回復されます。 状態が内部でどのように表されるか、およびチェックポイントに保持される方法と場所は、選択した状態バックエンドによって異なります。 詳細については、「Flink の概要 を参照してください。

Apache Spark

  • Apache Spark とは

    Apache Spark は、大規模なデータ セットに対して処理タスクを迅速に実行できるデータ処理フレームワークであり、単独で、または他の分散コンピューティング ツールと連携して、複数のコンピューターにデータ処理タスクを分散することもできます。

  • Spark でサポートされている言語 API は何ですか?

    AKS 上の Azure HDInsight では、Python と Scala がサポートされています。

  • AKS Spark 上の HDInsight では外部メタストアがサポートされていますか?

    AKS 上の HDInsight では、外部メタストア接続がサポートされます。 現在、外部メタストアとしてサポートされているのは Azure SQL DB のみです。

  • AKS Spark 上の HDInsight でジョブを送信するさまざまな方法は何ですか?

    Jupyter Notebook、Zeppelin Notebook、SDK、クラスター ターミナルを使用して、AKS Spark 上の HDInsight でジョブを送信できます。 詳細については、「AKS 上の HDInsight の Spark クラスターでジョブを送信および管理する」を参照してください。