Prozkoumání sady Python SDK
Důležité
V současné době existují dvě verze sady Python SDK: verze 1 (v1) a verze 2 (v2). Pro všechny nové projekty byste měli použít v2, a proto obsah v této lekci pokrývá pouze verzi 2. Přečtěte si další informace o rozhodování mezi v1 a v2.
Datoví vědci můžou pomocí služby Azure Machine Učení trénovat, sledovat a spravovat modely strojového učení. Jako datový vědec budete většinou pracovat s prostředky v pracovním prostoru Azure Machine Učení pro úlohy strojového učení.
Protože většina datových vědců je obeznámená s Pythonem, Azure Machine Učení nabízí sadu SDK (Software Development Kit), abyste mohli pracovat s pracovním prostorem pomocí Pythonu.
Sada Python SDK pro Azure Machine Učení je ideální nástroj pro datové vědce, který je možné použít v jakémkoli prostředí Pythonu. Bez ohledu na to, jestli běžně pracujete s poznámkovými bloky Jupyter, Visual Studio Code, můžete nainstalovat sadu Python SDK a připojit se k pracovnímu prostoru.
Instalace sady Python SDK
K instalaci sady Python SDK v prostředí Pythonu potřebujete Python 3.7 nebo novější. Balíček můžete nainstalovat pomocí pip
:
pip install azure-ai-ml
Poznámka:
Při práci s poznámkovými bloky v rámci studio Azure Machine Learning se nová sada Python SDK už nainstaluje při použití Pythonu 3.10 nebo novějšího. Sadu Python SDK v2 můžete použít se staršími verzemi Pythonu, ale musíte ji nejdřív nainstalovat.
Připojení do pracovního prostoru
Po instalaci sady Python SDK se budete muset připojit k pracovnímu prostoru. Připojením ověřujete své prostředí, abyste mohli s pracovním prostorem pracovat a vytvářet a spravovat prostředky a prostředky.
K ověření potřebujete hodnoty na tři nezbytné parametry:
subscription_id
: VAŠE ID předplatného.resource_group
: Název vaší skupiny prostředků.workspace_name
: Název pracovního prostoru.
Dále můžete ověřování definovat pomocí následujícího kódu:
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential
ml_client = MLClient(
DefaultAzureCredential(), subscription_id, resource_group, workspace
)
Po definování ověřování je potřeba volat MLClient
prostředí pro připojení k pracovnímu prostoru. Budete volat MLClient
kdykoli budete chtít vytvořit nebo aktualizovat prostředek nebo prostředek v pracovním prostoru.
Když například vytvoříte novou úlohu pro trénování modelu, připojíte se k pracovnímu prostoru:
from azure.ai.ml import command
# configure job
job = command(
code="./src",
command="python train.py",
environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
compute="aml-cluster",
experiment_name="train-model"
)
# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)
Použití referenční dokumentace
Pokud chcete efektivně pracovat se sadou Python SDK, budete muset použít referenční dokumentaci. V referenční dokumentaci najdete všechny možné třídy, metody a parametry dostupné v sadě Python SDK.
Referenční dokumentace ke MLClient
třídě obsahuje metody, které můžete použít k připojení a interakci s pracovním prostorem. Kromě toho také odkazuje na možné operace pro různé entity, jako je seznam existujících úložišť dat ve vašem pracovním prostoru.
Referenční dokumentace obsahuje také seznam tříd pro všechny entity , se kterými můžete pracovat. Například existují samostatné třídy, pokud chcete vytvořit úložiště dat, které odkazuje na Azure Blob Storage nebo na Azure Data Lake Gen2.
Výběrem konkrétní třídy, jako AmlCompute
je v seznamu entit, najdete podrobnější stránku o tom, jak třídu používat a jaké parametry přijímá.