Co jsou cílové výpočetní objekty ve službě Azure Machine Learning?

Článek
01/17/2025

Cílový výpočetní objekt je určený výpočetní prostředek nebo prostředí, ve kterém spouštíte trénovací skript nebo hostujete nasazení služby. Toto umístění může být místní počítač nebo cloudový výpočetní prostředek. Použití cílových výpočetních prostředků usnadňuje pozdější změnu výpočetního prostředí bez nutnosti měnit kód.

Azure Machine Learning má různou podporu napříč různými cíli výpočetních prostředků. V typickém životním cyklu vývoje modelu můžete:

Začněte vývojem a experimentováním s malým množstvím dat. V této fázi jako cíl výpočetních prostředků použijte místní prostředí, jako je místní počítač nebo cloudový virtuální počítač.
Vertikálně navyšte kapacitu na větší data nebo proveďte distribuované trénování pomocí jednoho z těchto trénovacích výpočetních cílů.
Jakmile je model připravený, nasaďte ho do hostitelského prostředí webu s jedním z těchto cílových výpočetních prostředků nasazení.

Výpočetní prostředky, které používáte pro cílové výpočetní objekty, jsou připojené k pracovnímu prostoru. Výpočetní prostředky jiné než místní počítač sdílí uživatelé pracovního prostoru.

Trénování cílových výpočetních prostředků

Při vertikálním navýšení kapacity trénování u větších datových sad nebo provádění distribuovaného trénování můžete pomocí výpočetních prostředků Azure Machine Learning vytvořit cluster s jedním nebo více uzly, který se automaticky škáluje při každém odeslání úlohy. Můžete také připojit vlastní výpočetní prostředek, i když se podpora pro různé scénáře může lišit.

Cílové výpočetní objekty je možné znovu použít z jedné trénovací úlohy na další. Například po připojení vzdáleného virtuálního počítače k pracovnímu prostoru ho můžete znovu použít pro více úloh.

Pro kanály strojového učení použijte příslušný krok kanálu pro každý cílový výpočetní objekt.

Pro trénovací cílový výpočetní objekt pro většinu úloh můžete použít libovolný z následujících prostředků. Ne všechny prostředky se dají použít pro automatizované strojové učení, kanály strojového učení nebo návrháře. Azure Databricks se dá použít jako trénovací prostředek pro místní spuštění a kanály strojového učení, ale ne jako vzdálený cíl pro jiné trénování.

Cíle trénování	Automatizované strojové učení	Kanály strojového učení	Návrhář služby Azure Machine Learning
Výpočetní cluster Azure Machine Learning	Ano	Ano	Yes
Bezserverové výpočetní prostředí služby Azure Machine Learning	Ano	Ano	Yes
Výpočetní instance služby Azure Machine Learning	Ano (prostřednictvím sady SDK)	Ano	Yes
Azure Machine Learning Kubernetes		Ano	Yes
Vzdálený virtuální počítač	Ano	Yes
Fondy Apache Sparku (Preview)	Ano (pouze místní režim sady SDK)	Ano
Azure Databricks	Ano (pouze místní režim sady SDK)	Ano
Azure Data Lake Analytics		Ano
Azure HDInsight		Ano
Azure Batch		Ano

Cíle trénování	Automatizované strojové učení	Kanály strojového učení	Návrhář služby Azure Machine Learning
Místní počítač	Ano
Výpočetní cluster Azure Machine Learning	Ano	Ano	Yes
Výpočetní instance služby Azure Machine Learning	Ano (prostřednictvím sady SDK)	Ano	Yes
Azure Machine Learning Kubernetes		Ano	Yes
Vzdálený virtuální počítač	Ano	Yes
Fondy Apache Sparku (Preview)	Ano (pouze místní režim sady SDK)	Ano
Azure Databricks	Ano (pouze místní režim sady SDK)	Ano
Azure Data Lake Analytics		Ano
Azure HDInsight		Ano
Azure Batch		Ano

Tip

Výpočetní instance má 120GB disk s operačním systémem. Pokud vám dojde místo na disku, před zastavením nebo restartováním výpočetní instance pomocí terminálu vymažte alespoň 1 až 2 GB.

Cílové výpočetní objekty pro odvozování

Při odvozování vytvoří Azure Machine Learning kontejner Dockeru, který je hostitelem modelu a přidružených prostředků potřebných k jeho použití. Tento kontejner se pak použije v cílovém výpočetním objektu.

Cílový výpočetní objekt, který používáte k hostování modelu, ovlivňuje náklady a dostupnost nasazeného koncového bodu. Tato tabulka slouží k výběru vhodného cílového výpočetního objektu.

Cílový výpočetní objekt	Použití	Podpora GPU	Popis
Koncové body služby Azure Machine Learning	Odvození v reálném čase Dávkové odvozování	Ano	Plně spravované výpočetní prostředky pro výpočetní prostředky bez serveru (spravované online koncové body) a dávkové vyhodnocování (dávkové koncové body).
Azure Machine Learning Kubernetes	Odvození v reálném čase Dávkové odvozování	Ano	Spouštění úloh odvození v místních clusterech, cloudech a hraničních clusterech Kubernetes

Cílový výpočetní objekt	Použití	Podpora GPU	Popis
Místní webová služba	Testování/ladění		Slouží k omezenému testování a řešení potíží. Hardwarová akcelerace závisí na použití knihoven v místním systému.
Azure Machine Learning Kubernetes	Odvozování v reálném čase	Ano	Spouštění úloh odvození v cloudu
Azure Container Instances	Odvození v reálném čase Doporučuje se pouze pro účely vývoje/testování.		Používá se pro úlohy založené na procesoru s nízkou škálou, které vyžadují méně než 48 GB paměti RAM. Nevyžaduje správu clusteru. Vhodné pouze pro modely menší než 1 GB. Podporováno v návrháři.

Poznámka:

Při výběru skladové položky clusteru nejprve vertikálně navyšte kapacitu a pak vertikálně navyšte kapacitu. Začněte počítačem, který má 150 % paměti RAM, který váš model vyžaduje, profilujte výsledek a najděte počítač, který má požadovaný výkon. Jakmile se to naučíte, zvyšte počet počítačů tak, aby vyhovoval vašim potřebujete pro souběžné odvozování.

Nasaďte a ohodnotit model strojového učení pomocí online koncového bodu.

Nasazení modelů strojového učení do Azure

Výpočetní prostředky služby Azure Machine Learning (spravované)

Azure Machine Learning vytváří a spravuje spravované výpočetní prostředky. Tento typ výpočetních prostředků je optimalizovaný pro úlohy strojového učení. Jedinými spravovanými výpočetními prostředky jsou výpočetní clustery Azure Machine Learning, bezserverové výpočetní služby a výpočetní instance.

Není potřeba vytvářet bezserverové výpočetní prostředky. Výpočetní instance služby Azure Machine Learning nebo výpočetní clustery můžete vytvořit z:

Azure Machine Learning Studio
Sada Python SDK a Azure CLI:
- Výpočetní instance
- Výpočetní cluster
Šablona Azure Resource Manageru. Příklad šablony najdete v tématu Vytvoření výpočetního clusteru Azure Machine Learning.

Poznámka:

Místo vytváření výpočetního clusteru využijte bezserverové výpočetní prostředky k přesměrování správy životního cyklu výpočetního cyklu do služby Azure Machine Learning.

Při vytváření jsou tyto výpočetní prostředky automaticky součástí vašeho pracovního prostoru, na rozdíl od jiných typů cílových výpočetních prostředků.

Schopnost	Výpočtový cluster	Výpočetní instance
Cluster s jedním nebo více uzly	✓	Cluster s jedním uzlem
Automatické škálování při každém odeslání úlohy	✓
Automatická správa clusteru a plánování úloh	✓	✓
Podpora prostředků PROCESORu i GPU	✓	✓

Poznámka:

Abyste se vyhnuli poplatkům za nečinnost výpočetních prostředků:

V případě výpočetního clusteru se ujistěte, že je minimální počet uzlů nastavený na 0, nebo použijte bezserverové výpočetní prostředky.
U výpočetní instance povolte vypnutí nečinnosti. I když zastavení výpočetní instance zastaví účtování výpočetního času, bude se vám stále účtovat disk, veřejná IP adresa a nástroj pro vyrovnávání zatížení úrovně Standard.

Podporované řady a velikosti virtuálních počítačů

Důležité

Pokud jsou vaše výpočetní instance nebo výpočetní clustery založené na některé z těchto řad, vytvořte znovu jinou velikost virtuálního počítače.

Tyto série byly vyřazeny 31. srpna 2023:

Tyto série byly vyřazeny 31. srpna 2024:

Když vyberete velikost uzlu pro spravovaný výpočetní prostředek ve službě Azure Machine Learning, můžete si vybrat z vybraných velikostí virtuálních počítačů dostupných v Azure. Azure nabízí řadu velikostí pro Linux a Windows pro různé úlohy. Další informace najdete v tématu Typy a velikosti virtuálních počítačů.

Při výběru velikosti virtuálního počítače existuje několik výjimek a omezení:

Některé řady virtuálních počítačů nejsou ve službě Azure Machine Learning podporované.
Některé řady virtuálních počítačů, jako jsou GPU a jiné speciální skladové položky, se nemusí zpočátku zobrazovat v seznamu dostupných virtuálních počítačů. Přesto je ale můžete použít, jakmile požádáte o změnu kvóty. Další informace o vyžádání kvót najdete v tématu Žádost o navýšení kvóty a limitu.

Další informace o podporovaných řadách najdete v následující tabulce.

Podporovaná řada virtuálních počítačů	Kategorie	Podporováno
DDSv4	Obecné účely	Výpočetní clustery a instance
Dv2	Obecné účely	Výpočetní clustery a instance
Dv3	Obecné účely	Výpočetní clustery a instance
DSv2	Obecné účely	Výpočetní clustery a instance
DSv3	Obecné účely	Výpočetní clustery a instance
EAv4	Optimalizované pro paměť	Výpočetní clustery a instance
Ev3	Optimalizované pro paměť	Výpočetní clustery a instance
ESv3	Optimalizované pro paměť	Výpočetní clustery a instance
FSv2	Optimalizované pro výpočty	Výpočetní clustery a instance
Trh zahraničních měn	Optimalizované pro výpočty	Výpočetní clustery
H	Vysokovýkonné výpočetní prostředí	Výpočetní clustery a instance
HEMOGLOBIN	Vysokovýkonné výpočetní prostředí	Výpočetní clustery a instance
HBv2	Vysokovýkonné výpočetní prostředí	Výpočetní clustery a instance
HBv3	Vysokovýkonné výpočetní prostředí	Výpočetní clustery a instance
HC	Vysokovýkonné výpočetní prostředí	Výpočetní clustery a instance
LSv2	Optimalizované pro úložiště	Výpočetní clustery a instance
M	Optimalizované pro paměť	Výpočetní clustery a instance
NC	GPU	Výpočetní clustery a instance
NC Promo	GPU	Výpočetní clustery a instance
NCv2	GPU	Výpočetní clustery a instance
NCv3	GPU	Výpočetní clustery a instance
ND	GPU	Výpočetní clustery a instance
NDv2	GPU	Výpočetní clustery a instance
NV	GPU	Výpočetní clustery a instance
NVv3	GPU	Výpočetní clustery a instance
NCasT4_v3	GPU	Výpočetní clustery a instance
NDasrA100_v4	GPU	Výpočetní clustery a instance

Azure Machine Learning sice tyto řady virtuálních počítačů podporuje, ale nemusí být dostupné ve všech oblastech Azure. Pokud chcete zkontrolovat, jestli jsou řady virtuálních počítačů dostupné, podívejte se na produkty dostupné v jednotlivých oblastech.

Poznámka:

Azure Machine Learning nepodporuje všechny velikosti virtuálních počítačů, které Azure Compute podporuje. Pokud chcete zobrazit seznam dostupných velikostí virtuálních počítačů, použijte následující metodu:

REST API

Poznámka:

REST API
Rozšíření Azure CLI 2.0 pro příkaz strojového učení az ml compute list-sizes.

Pokud používáte cílové výpočetní objekty s podporou GPU, je důležité zajistit, aby byly v trénovacím prostředí nainstalované správné ovladače CUDA. Pomocí následující tabulky určete správnou verzi CUDA, která se má použít:

Architektura GPU	Řada virtuálních počítačů Azure	Podporované verze CUDA
Ampér	NDA100_v4	11.0+
Turing	NCT4_v3	10.0+
Volta	NCv3, NDv2	9.0+
Pascal	NCv2, ND	9.0+
Maxwell	NV, NVv3	9.0+
Kepler	NC, NC Promo	9.0+

Kromě zajištění kompatibility verze a hardwaru CUDA se také ujistěte, že je verze CUDA kompatibilní s verzí architektury strojového učení, kterou používáte:

V případě PyTorch můžete zkontrolovat kompatibilitu na stránce předchozích verzí PyTorchu.
V případě Tensorflowu můžete zkontrolovat kompatibilitu tak , že navštívíte build Tensorflow ze zdrojové stránky.

Izolace výpočetních prostředků

Výpočetní prostředí Azure Machine Learning nabízí velikosti virtuálních počítačů, které jsou izolované od konkrétního typu hardwaru a vyhrazené pro jednoho zákazníka. Velikosti izolovaných virtuálních počítačů jsou nejvhodnější pro úlohy, které vyžadují vysokou míru izolace od úloh jiných zákazníků z důvodů, které zahrnují dodržování předpisů a zákonné požadavky. Použití izolované velikosti zaručuje, že váš virtuální počítač je jediný spuštěný na konkrétní instanci serveru.

Mezi aktuální nabídky izolovaných virtuálních počítačů patří:

Standard_M128ms
Standard_F72s_v2
Standard_NC24s_v3
Standard_NC24rs_v3 (s podporou RDMA)

Další informace o izolaci najdete v tématu Izolace ve veřejném cloudu Azure.

Nespravované výpočetní prostředky

Azure Machine Learning nespravuje nespravovaný cílový výpočetní objekt. Tento typ cílového výpočetního objektu vytvoříte mimo službu Azure Machine Learning a pak ho připojíte ke svému pracovnímu prostoru. Nespravované výpočetní prostředky můžou vyžadovat další kroky, které vám umožní udržovat nebo zlepšit výkon úloh strojového učení.

Azure Machine Learning podporuje následující typy nespravovaných výpočetních prostředků:

Vzdálené virtuální počítače
Azure HDInsight
Azure Databricks
Azure Data Lake Analytics

Azure Kubernetes Service
Fond Azure Synapse Spark (zastaralý)

Kubernetes

Další informace najdete v tématu Správa výpočetních prostředků.

Nasazení a určení skóre modelu strojového učení pomocí online koncového bodu

Nasazení modelů strojového učení do Azure

Sdílet prostřednictvím

Co jsou cílové výpočetní objekty ve službě Azure Machine Learning?

Trénování cílových výpočetních prostředků

Cílové výpočetní objekty pro odvozování

Výpočetní prostředky služby Azure Machine Learning (spravované)

Podporované řady a velikosti virtuálních počítačů

Izolace výpočetních prostředků

Nespravované výpočetní prostředky

Váš názor

Další materiály

Sdílet prostřednictvím

Co jsou cílové výpočetní objekty ve službě Azure Machine Learning?

Trénování cílových výpočetních prostředků

Cílové výpočetní objekty pro odvozování

Výpočetní prostředky služby Azure Machine Learning (spravované)

Podporované řady a velikosti virtuálních počítačů

Izolace výpočetních prostředků

Nespravované výpočetní prostředky

Související obsah

Váš názor

Další materiály