Freigeben über


Anfügen und Verwalten eines Synapse Spark-Pools in Azure Machine Learning

GILT FÜR:Azure CLI ML-Erweiterung v2 (aktuell)Python SDK azure-ai-ml v2 (aktuell)

In diesem Artikel erfahren Sie, wie Sie einen Synapse Spark-Pool in Azure Machine Learning anfügen. Sie können einen Synapse Spark-Pool in Azure Machine Learning auf eine der folgenden Weisen anfügen:

  • Verwenden der Benutzeroberfläche von Azure Machine Learning Studio
  • Verwenden der Azure Machine Learning-CLI
  • Verwenden des Python SDK für Azure Machine Learning

Voraussetzungen

Anfügen eines Synapse Spark-Pools in Azure Machine Learning

Azure Machine Learning bietet verschiedene Möglichkeiten zum Anfügen und Verwalten eines Synapse Spark-Pools.

So fügen Sie einen Synapse Spark-Pool mit der Registerkarte „Studio-Compute“ an:

Screenshot: Erstellen eines neuen Synapse Spark-Pools

  1. Wählen Sie im Bereich Verwalten des linken Bereichs die Option Compute aus.
  2. Wählen Sie Angefügte Computeressourcen aus.
  3. Wählen Sie auf dem Bildschirm Angefügte Computeressourcen die Option Neu aus, um die Optionen zum Anfügen verschiedener Computetypen anzuzeigen.
  4. Wählen Sie Synapse Spark-Pool aus.

Der Bereich Synapse Spark-Pool anfügen öffnet sich auf der rechten Seite des Bildschirms. In diesem Bereich:

  1. Geben Sie einen Namen ein, der auf den angefügten Synapse Spark-Pool in Azure Machine Learning Ressource verweist.

  2. Wählen Sie im Dropdownmenü ein Azure-Abonnement aus.

  3. Wählen Sie einen Synapse-Arbeitsbereich im Dropdownmenü aus.

  4. Wählen Sie im Dropdownmenü einen Spark-Pool aus.

  5. Schalten Sie die Option Verwaltete Identität zuweisen um, um sie zu aktivieren.

  6. Wählen Sie einen verwalteten Identitätstyp aus, der mit diesem angefügten Synapse Spark-Pool verwendet werden soll.

  7. Wählen Sie Aktualisieren aus, um den Anfügevorgang für den Synapse Spark-Pool abzuschließen.

Hinzufügen von Rollenzuweisungen in Azure Synapse Analytics

Um sicherzustellen, dass der angefügte Synapse Spark-Pool ordnungsgemäß funktioniert, weisen Sie ihm die Administratorrolle über die Benutzeroberfläche von Azure Synapse Analytics Studio zu. Die folgenden Schritte veranschaulichen die Vorgehensweise:

  1. Öffnen Sie Ihren Synapse-Arbeitsbereich im Azure-Portal.

  2. Wählen Sie im linken Bereich Übersicht aus.

    Screenshot: Öffnen von Synapse Studio

  3. Wählen Sie Synapse Studio öffnen aus.

  4. Wählen Sie im Azure Synapse Analytics Studio im linken Bereich Verwalten aus.

  5. Wählen Sie Access Control im Abschnitt Sicherheit im linken Bereich aus, zweiter von links.

  6. Wählen Sie Hinzufügen aus.

  7. Auf der rechten Seite des Bildschirms wird das Fenster Rollenzuweisung hinzufügen geöffnet. In diesem Bereich:

    1. Wählen Sie unter Bereich die Option Arbeitsbereichselementaus.

    2. Wählen Sie im Dropdownmenü Elementtyp die Option Apache Spark-Pool aus.

    3. Wählen Sie im Dropdownmenü Element Ihren Apache Spark-Pool aus.

    4. Wählen Sie im Dropdownmenü Rolle die Option Synapse-Administrator aus.

    5. Beginnen Sie im Suchfeld Benutzer auswählen mit der Eingabe des Namens Ihres Azure Machine Learning-Arbeitsbereichs. Es wird eine Liste der angefügten Synapse Spark-Pools angezeigt. Wählen Sie Ihren gewünschten Synapse Spark-Pool aus der Liste aus.

    6. Wählen Sie Übernehmen.

      Screenshot: Rollenzuweisung hinzufügen

Aktualisieren des Synapse Spark-Pools

Sie können den angefügten Synapse Spark-Pool über die Benutzeroberfläche von Azure Machine Learning Studio verwalten. Die Verwaltungsfunktionen für Spark-Pools umfassen Updates für zugeordnete verwaltete Identitäten für einen angefügten Synapse Spark-Pool. Sie können eine system- oder benutzerseitig zugewiesene Identität zuweisen, während Sie einen Synapse Spark-Pool aktualisieren. Sie sollten eine benutzerseitig zugewiesene verwaltete Identität im Azure-Portal erstellen, bevor Sie sie einem Synapse Spark-Pool zuweisen.

So aktualisieren Sie die verwaltete Identität für den angefügten Synapse Spark-Pool

Screenshot: Update der verwalteten Identität des Synapse Spark-Pools

  1. Öffnen Sie die Seite Details für den Synapse Spark-Pool im Azure Machine Learning Studio.

  2. Suchen Sie das Bearbeitungssymbol auf der rechten Seite des Abschnitts Verwaltete Identität aus.

  3. Aktivieren Sie die Option Verwaltete Identität zuweisen, um eine verwaltete Identität zum ersten Mal zuzuweisen.

  4. So weisen Sie eine systemseitig zugewiesene verwaltete Identität zu

    1. Wählen Sie Systemseitig zugewiesen als Identitätstypaus.
    2. Wählen Sie Aktualisieren aus.
  5. So weisen Sie eine benutzerseitig zugewiesene verwaltete Identität zu

    1. Wählen Sie Benutzerseitig zugewiesen als Identitätstypaus.
    2. Wählen Sie im Dropdownmenü ein Azure-Abonnement aus.
    3. Geben Sie die ersten Buchstaben des Namens der benutzerseitig zugewiesenen verwalteten Identität in das Feld, das den Text Nach Name suchen zeigt, ein. Eine Liste mit übereinstimmenden Namen der benutzerseitig zugewiesenen verwalteten Identität wird angezeigt. Wählen Sie die gewünschte benutzerseitig zugewiesene verwaltete Identität aus der Liste aus. Sie können mehrere benutzerseitig zugewiesene verwaltete Identitäten auswählen und sie dem angefügten Synapse Spark-Pool zuweisen.
    4. Wählen Sie Aktualisieren.

Trennen des Synapse Spark-Pools

Möglicherweise möchten wir einen angefügten Synapse Spark-Pool trennen, um einen Arbeitsbereich zu bereinigen.


Die Azure Machine Learning Studio-Benutzeroberfläche bietet auch eine Möglichkeit, einen angefügten Synapse Spark-Pool zu trennen. Gehen Sie dazu wie folgt vor:

  1. Öffnen Sie die Seite Details für den Synapse Spark-Pool im Azure Machine Learning Studio.

  2. Wählen Sie Trennen aus, um den angefügten Synapse Spark-Pool zu trennen.

Serverloses Spark Compute in Azure Machine Learning

Einige Benutzerszenarien erfordern möglicherweise während einer Azure Machine Learning-Auftragsübermittlung Zugriff auf einen serverlosen Spark Compute Ressource, ohne dass ein Spark-Pool angefügt werden muss. Die Azure Synapse Analytics-Integration in Azure Machine Learning bietet auch eine serverlose Spark-Computeumgebung. Dies ermöglicht den Zugriff auf ein Spark Compute in einem Auftrag, ohne dass das Compute zunächst an einen Arbeitsbereich angehängt werden muss. Erfahren Sie mehr über das serverlose Spark Compute.

Nächste Schritte