Co je pracovní prostor služby Azure Machine Learning?
Pracovní prostory jsou místa pro spolupráci s kolegy za účelem vytvoření artefaktů strojového učení a práce souvisejících se skupinami. Například experimenty, úlohy, datové sady, modely, komponenty a koncové body odvozování. Tento článek popisuje pracovní prostory, jak spravovat přístup k nim a jak je používat k uspořádání práce.
Jste připravení začít? Vytvořte pracovní prostor.
Úlohy prováděné v pracovním prostoru
Pro týmy strojového učení je pracovní prostor místem pro uspořádání práce. Tady jsou některé úlohy, které můžete začít z pracovního prostoru:
- Vytváření úloh – Úlohy jsou trénovací běhy, které používáte k sestavení modelů. Úlohy můžete seskupit do experimentů a porovnat metriky .
- Vytváření kanálů – Kanály jsou opakovaně použitelné pracovní postupy pro trénování a opětovné trénování modelu.
- Registrace datových prostředků – Pomoc datovým prostředkům při správě dat, která používáte k trénování modelu a vytváření kanálů.
- Zaregistrujte modely – Jakmile budete mít model, který chcete nasadit, vytvoříte registrovaný model.
- Vytvoření online koncových bodů – k vytvoření online koncového bodu použijte registrovaný model a bodovací skript.
- Nasazení modelu – k nasazení modelu použijte registrovaný model a bodovací skript.
Kromě seskupení výsledků strojového učení hostují pracovní prostory také konfigurace prostředků:
- Cílové výpočetní objekty se používají ke spouštění experimentů.
- Úložiště dat definují, jak se vy a ostatní můžete připojit ke zdrojům dat při použití datových prostředků.
- Nastavení zabezpečení – sítě, identita a řízení přístupu a nastavení šifrování.
Uspořádání pracovních prostorů
Pro vedoucí a správce týmu strojového učení slouží pracovní prostory jako kontejnery pro správu přístupu, správu nákladů a izolaci dat. Tady je několik tipů pro uspořádání pracovních prostorů:
- Role uživatelů slouží ke správě oprávnění v pracovním prostoru mezi uživateli. Například datový vědec, technik strojového učení nebo správce.
- Přiřaďte přístup ke skupinám uživatelů: Pomocí skupin uživatelů Microsoft Entra nemusíte přidávat jednotlivé uživatele do každého pracovního prostoru a do jiných prostředků, ke kterým stejná skupina uživatelů vyžaduje přístup.
- Vytvořte pracovní prostor na jeden projekt: Zatímco pracovní prostor lze použít pro více projektů, jeho omezení na jeden projekt na jeden pracovní prostor umožňuje generování sestav nákladů na úrovni projektu. Umožňuje také spravovat konfigurace, jako jsou úložiště dat v rozsahu každého projektu.
- Sdílení prostředků Azure: Pracovní prostory vyžadují, abyste vytvořili několik přidružených prostředků. Sdílejte tyto prostředky mezi pracovními prostory, abyste uložili opakující se kroky nastavení.
- Povolit samoobslužné funkce: Předem vytvořte a zabezpečte přidružené prostředky jako správce IT a pomocí rolí uživatelů můžete datovým vědcům umožnit vytvářet pracovní prostory samostatně.
- Sdílení prostředků: Prostředky můžete sdílet mezi pracovními prostory pomocí registrů služby Azure Machine Learning.
Jak je můj obsah uložený v pracovním prostoru?
Váš pracovní prostor uchovává historii všech trénovacích běhů s protokoly, metrikami, výstupem, metadaty rodokmenu a snímkem vašich skriptů. Při provádění úloh ve službě Azure Machine Learning se vygenerují artefakty. Jejich metadata a data jsou uložena v pracovním prostoru a v přidružených prostředcích.
Přidružené prostředky
Když vytvoříte nový pracovní prostor, budete muset zajistit další prostředky Azure k ukládání dat. Pokud tyto prostředky neposkytujete, služba Azure Machine Learning je automaticky vytvoří.
Účet služby Azure Storage. Ukládá artefakty strojového učení, jako jsou protokoly úloh. Ve výchozím nastavení se tento účet úložiště používá při nahrávání dat do pracovního prostoru. Poznámkové bloky Jupyter, které se používají s vašimi výpočetními instancemi služby Azure Machine Learning, jsou uložené i tady.
Důležité
Pokud se jedná o tento účet, nemůžete použít existující účet Azure Storage:
- Účet typu BlobStorage
- Účet Premium (Premium_LRS a Premium_GRS)
- Účet s hierarchickým oborem názvů (používaným s Azure Data Lake Storage Gen2).
Úložiště dat můžete použít jako další úložiště úložiště úrovně Premium nebo hierarchický obor názvů.
Po upgradu na úložiště pro obecné účely verze 2 nepovolujte v účtu úložiště hierarchický obor názvů.
Pokud máte existující účet úložiště pro obecné účely verze 1, můžete ho po vytvoření pracovního prostoru upgradovat na verzi pro obecné účely verze 2 .
Azure Container Registry (ACR) Ukládá vytvořené kontejnery Dockeru, když vytváříte vlastní prostředí prostřednictvím služby Azure Machine Learning. Nasazením modelů a datového profilu AutoML se také aktivuje vytváření vlastních prostředí.
Pracovní prostory je možné vytvářet bez ACR jako závislosti, pokud nepotřebujete vytvářet vlastní kontejnery Dockeru. Azure Machine Learning může číst z externích registrů kontejnerů.
ACR se automaticky zřídí při vytváření vlastních imagí Dockeru. Pomocí řízení přístupu na základě role v Azure (Azure RBAC) zabráníte tomu, aby se kontejnery Dockeru zákazníka sestavily.
Důležité
Pokud vaše nastavení předplatného vyžaduje přidání značek k prostředkům, služba ACR vytvořená službou Azure Machine Learning selže, protože značky nemůžeme nastavit na ACR.
Aplikace Azure lication Insights. Pomáhá monitorovat a shromažďovat diagnostické informace z koncových bodů odvozování.
Další informace najdete v tématu Monitorování online koncových bodů.
Azure Key Vault. Ukládá tajné kódy používané cílovými výpočetními objekty a další citlivé informace, které pracovní prostor potřebuje.
Vytvoření pracovního prostoru
Pracovní prostor můžete vytvořit několika způsoby. Pokud chcete začít, použijte jednu z následujících možností:
- Studio Azure Machine Learning umožňuje rychle vytvořit pracovní prostor s výchozím nastavením.
- Pomocí webu Azure Portal můžete použít rozhraní typu point-and-click s dalšími možnostmi zabezpečení.
- Pokud pracujete v editoru Visual Studio Code, použijte rozšíření VS Code.
Automatizace vytváření pracovních prostorů pomocí upřednostňovaného nastavení zabezpečení:
- Šablony Azure Resource Manageru / Bicep poskytují deklarativní syntaxi pro nasazení prostředků Azure. Alternativní možností je použít Terraform. Viz také šablona Bicep nebo šablona Terraformu.
- K vytváření prototypů a jako součást pracovních postupů MLOps použijte azure Machine Learning CLI nebo sadu Azure Machine Learning SDK pro Python.
- K vytváření prototypů a jako součást pracovních postupů MLOps použijte azure Machine Learning CLI nebo sadu Azure Machine Learning SDK pro Python.
- Rozhraní REST API můžete použít přímo ve skriptovacím prostředí pro integraci platformy nebo v pracovních postupech MLOps.
Nástroje pro interakci a správu pracovního prostoru
Jakmile je pracovní prostor nastavený, můžete s ním pracovat následujícími způsoby:
- V jakémkoli prostředí Pythonu pomocí sady Azure Machine Learning SDK.
- Na příkazovém řádku pomocí rozšíření Azure Machine Learning CLI v2
- V jakémkoli prostředí Pythonu pomocí sady Azure Machine Learning SDK
- Na příkazovém řádku pomocí rozšíření Azure Machine Learning CLI v1
V každém rozhraní jsou k dispozici následující úlohy správy pracovních prostorů.
Úloha správy pracovních prostorů | Portál | Studio | Python SDK | Azure CLI | VS Code |
---|---|---|---|---|---|
Vytvoření pracovního prostoru | ✓ | ✓ | ✓ | ✓ | ✓ |
Správa přístupu k pracovnímu prostoru | ✓ | ✓ | |||
Vytváření a správa výpočetních prostředků | ✓ | ✓ | ✓ | ✓ | ✓ |
Vytvoření výpočetní instance | ✓ | ✓ | ✓ | ✓ |
Upozorňující
Přesun pracovního prostoru Azure Machine Learning do jiného předplatného nebo přesun vlastního předplatného do nového tenanta se nepodporuje. To může způsobit chyby.
Dílčí prostředky
Při vytváření výpočetních clusterů a výpočetních instancí ve službě Azure Machine Learning se vytvoří dílčí prostředky.
- Virtuální počítače: Poskytují výpočetní výkon pro výpočetní instance a výpočetní clustery, které používáte ke spouštění úloh.
- Load Balancer: Nástroj pro vyrovnávání zatížení sítě se vytvoří pro každou výpočetní instanci a výpočetní cluster pro správu provozu, i když se výpočetní instance nebo cluster zastaví.
- Virtuální síť: Tyto služby pomáhají prostředkům Azure komunikovat mezi sebou, internetem a dalšími místními sítěmi.
- Šířka pásma: Zapouzdřuje všechny odchozí přenosy dat napříč oblastmi.
Další kroky
Další informace o plánování pracovního prostoru pro požadavky vaší organizace najdete v tématu Uspořádání a nastavení služby Azure Machine Learning.
Pokud chcete začít se službou Azure Machine Learning, přečtěte si: