次の方法で共有


Azure Machine Learning で Synapse Spark プールをアタッチして管理する

適用対象:Azure CLI ml extension v2 (現行)Python SDK azure-ai-ml v2 (現行)

この記事では、Azure Machine Learning で Synapse Spark プールをアタッチする方法について説明します。 Azure Machine Learning では、次のいずれかの方法で Synapse Spark プールをアタッチできます。

  • Azure Machine Learning スタジオ UI を使用する
  • Azure Machine Learning CLI を使用する
  • Azure Machine Learning Python SDK を使用する

前提条件

Azure Machine Learning で Synapse Spark プールをアタッチする

Azure Machine Learning には、Synapse Spark プールをアタッチして管理するためのさまざまな方法があります。

[Studio コンピューティング] タブを使用して Synapse Spark プールをアタッチするには:

新しい Synapse Spark プールの作成を示すスクリーンショット。

  1. 左側のペインの [管理] セクションで、[コンピューティング] を選びます。
  2. [アタッチされたコンピューティング] を選びます。
  3. [アタッチされたコンピューティング] 画面で、[新規] を選び、さまざまな種類のコンピューティングをアタッチするためのオプションを表示します。
  4. [Synapse Spark プール] を選びます。

[Synapse Spark プールのアタッチ] パネルが画面の右側に開きます。 このパネルで:

  1. [名前] を入力します。この名前は、Azure Machine Learning リソース内のアタッチされた Synapse Spark プールを指します。

  2. ドロップダウン メニューから Azure サブスクリプションを選びます。

  3. ドロップダウン メニューから [Synapse ワークスペース] を選びます。

  4. ドロップダウン メニューから [Spark プール] を選びます。

  5. [マネージド ID の割り当て] オプションを切り替えて有効にします。

  6. このアタッチされた Synapse Spark プールで使用するマネージド ID の種類を選びます。

  7. [更新] を選んで、Synapse Spark プールのアタッチ プロセスを完了します。

Azure Synapse Analytics でロールの割り当てを追加する

アタッチされた Synapse Spark プールが正しく機能することを確認するには、Azure Synapse Analytics Studio UI から管理者ロールを割り当てます。 次のステップで、これを実行する方法を説明します。

  1. Azure portal で Synapse ワークスペースを開きます。

  2. 左側のペインで、[概要] を選択します。

    [Synapse Studio を開く] を示すスクリーンショット。

  3. [Synapse Studio を開く] を選びます。

  4. Azure Synapse Analytics スタジオで、左側のペインで [管理] を選びます。

  5. 左側のペインの [セキュリティ] セクションで、左から 2 番目の [アクセスの制御] を選びます。

  6. [追加] を選択します。

  7. 画面の右側に [ロールの割り当ての追加] パネルが開きます。 このパネルで:

    1. [スコープ][ワークスペース項目] を選びます。

    2. [項目の種類] ドロップダウン メニューで、[Apache Spark プール] を選びます。

    3. [項目] ドロップダウン メニューで、Apache Spark プールを選びます。

    4. [ロール] ドロップダウン メニューで、[Synapse 管理者] を選びます。

    5. [ユーザーの選択] 検索ボックスに、Azure Machine Learning ワークスペースの名前の入力を開始します。 アタッチされた Synapse Spark プールのリストが表示されます。 リストから目的の Synapse Spark プールを選びます。

    6. [適用] を選択します。

      [ロールの割り当ての追加] を示すスクリーンショット。

Synapse Spark プールを更新する

アタッチされた Synapse Spark プールは、Azure Machine Learning スタジオ UI から管理できます。 Spark プール管理機能には、アタッチされた Synapse Spark プールに関連付けられたマネージド ID の更新が含まれます。 Synapse Spark プールの更新中に、システム割り当て ID またはユーザー割り当て ID を割り当てることができます。 Synapse Spark プールに割り当てる前に、Azure portal でユーザー割り当てマネージド ID を作成する必要があります。

アタッチされた Synapse Spark プールのマネージド ID を更新するには:

Synapse Spark プールのマネージド ID の更新を示すスクリーンショット。

  1. Azure Machine Learning スタジオで Synapse Spark プールの [詳細] ページを開きます。

  2. [マネージド ID] セクションの右側にある編集アイコンを見つけます。

  3. マネージド ID を初めて割り当てるには、[マネージド ID の割り当て] を切り替えて有効にします。

  4. システム割り当てマネージド ID を割り当てるには:

    1. [ID の種類] として [システム割り当て] を選びます。
    2. [Update](更新) を選択します。
  5. ユーザー割り当てマネージド ID を割り当てるには:

    1. [ID の種類] として [ユーザー割り当て] を選びます。
    2. ドロップダウン メニューから Azure サブスクリプションを選びます。
    3. [名前で検索] というテキストが表示されているボックスに、ユーザー割り当てマネージド ID の名前の最初の数文字を入力します。 一致するユーザー割り当てマネージド ID 名のリストが表示されます。 リストから目的のユーザー割り当てマネージド ID を選びます。 複数のユーザー割り当てマネージド ID を選び、それらをアタッチされた Synapse Spark プールに割り当てることができます。
    4. [更新] を選択します。

Synapse Spark プールをデタッチする

アタッチされた Synapse Spark プールをデタッチして、ワークスペースをクリーンアップしたい場合があります。


Azure Machine Learning スタジオ UI には、アタッチされた Synapse Spark プールをデタッチする方法も用意されています。 これを行うには、次の手順を実行します。

  1. Azure Machine Learning スタジオで Synapse Spark プールの [詳細] ページを開きます。

  2. [デタッチ] を選び、アタッチされた Synapse Spark プールをデタッチします。

Azure Machine Learning でのサーバーレス Spark コンピューティング

一部のユーザー シナリオでは、Azure Machine Learning ジョブの送信中に、Spark プールをアタッチすることなくサーバーレス Spark コンピューティング リソースへのアクセスが必要になる場合があります。 Azure Synapse Analytics と Azure Machine Learning の統合により、サーバーレス Spark コンピューティング エクスペリエンスも提供されます。 これにより、コンピューティングをワークスペースにアタッチせずに、ジョブ内の Spark コンピューティングにアクセスできます。 サーバーレス Spark コンピューティング エクスペリエンスについては、こちらを参照してください。

次のステップ