Erkunden des Python SDK

Abgeschlossen

Wichtig

Derzeit gibt es zwei Versionen des Python SDK: Version 1 (v1) und Version 2 (v2). Für alle neuen Projekte sollten Sie v2 verwenden und der Inhalt daher in dieser Einheit nur v2abdeckt. Erfahren Sie mehr über die Entscheidung zwischen v1 und v2.

Data Scientists können Azure Machine Learning verwenden, um Machine Learning-Modelle zu trainieren, zu verfolgen und zu verwalten. Als Data Scientist arbeiten Sie hauptsächlich mit den Ressourcen im Azure Machine Learning-Arbeitsbereich für Ihre Machine Learning-Arbeitslasten.

Da die meisten Data Scientists mit Python vertraut sind, bietet Azure Machine Learning ein Software Development Kit (SDK) an, damit Sie mit dem Arbeitsbereich mit Python interagieren können.

Das Python SDK für Azure Machine Learning ist ein ideales Tool für Data Scientists, das in jeder Python-Umgebung verwendet werden kann. Unabhängig davon, ob Sie normalerweise mit Jupyter-Notizbüchern, Visual Studio Code, arbeiten, können Sie das Python SDK installieren und eine Verbindung mit dem Arbeitsbereich herstellen.

Installieren des Python SDK

Um das Python SDK in Ihrer Python-Umgebung zu installieren, benötigen Sie Python 3.7 oder höher. Sie können das Paket mit pipinstallieren:

pip install azure-ai-ml

Anmerkung

Beim Arbeiten mit Notizbüchern im Azure Machine Learning Studio ist das neue Python SDK bereits installiert, wenn Python 3.10 oder höher verwendet wird. Sie können das Python SDK v2 mit früheren Versionen von Python verwenden, aber Sie müssen es zuerst installieren.

Mit dem Arbeitsbereich verbinden

Nachdem das Python SDK installiert wurde, müssen Sie eine Verbindung mit dem Arbeitsbereich herstellen. Durch das Herstellen einer Verbindung authentifizieren Sie Ihre Umgebung, um mit dem Arbeitsbereich zu interagieren und Assets sowie Ressourcen zu erstellen und zu verwalten.

Zum Authentifizieren benötigen Sie die Werte für drei erforderliche Parameter:

  • subscription_id: Ihre Abonnement-ID.
  • resource_group: Der Name der Ressourcengruppe.
  • workspace_name: Der Name Ihres Arbeitsbereichs.

Als Nächstes können Sie die Authentifizierung mithilfe des folgenden Codes definieren:

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)

Nach dem Definieren der Authentifizierung müssen Sie MLClient für die Umgebung aufrufen, um eine Verbindung mit dem Arbeitsbereich herzustellen. Sie können MLClient jederzeit anrufen, wenn Sie ein Asset oder eine Ressource im Arbeitsbereich erstellen oder aktualisieren möchten.

Sie stellen beispielsweise eine Verbindung zum Arbeitsbereich her, wenn Sie einen neuen Auftrag erstellen, um ein Modell zu trainieren:

from azure.ai.ml import command

# configure job
job = command(
    code="./src",
    command="python train.py",
    environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
    compute="aml-cluster",
    experiment_name="train-model"
)

# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)

Verwenden der Referenzdokumentation

Um effizient mit dem Python SDK zu arbeiten, müssen Sie die Referenzdokumentation verwenden. In der Referenzdokumentation finden Sie alle möglichen Klassen, Methoden und Parameter, die im Python SDK verfügbar sind.

Die Referenzdokumentation zur MLClient Klasse enthält die Methoden, mit deren Hilfe Sie eine Verbindung mit dem Arbeitsbereich herstellen und damit interagieren können. Darüber hinaus wird es auch mit den möglichen Vorgängen für die verschiedenen Entitäten verknüpft, z. B. wie die vorhandenen Datenspeicher in Ihrem Arbeitsbereich aufgeführt werden.

Die Referenzdokumentation enthält auch eine Liste der Klassen für alle Entitäten mit denen Sie interagieren können. Beispielsweise sind separate Klassen vorhanden, wenn Sie einen Datenspeicher erstellen möchten, der mit einem Azure Blob Storage verknüpft ist, oder mit einem Azure Data Lake Gen 2.

Wenn Sie eine bestimmte Klasse wie AmlCompute aus der Liste der Entitäten auswählen, finden Sie eine detailliertere Seite zur Verwendung der Klasse und zu den Parametern, die sie akzeptiert,.