Volba vhodného cílového výpočetního objektu
Ve službě Azure Machine Učení jsou cílové výpočetní objekty fyzické nebo virtuální počítače, na kterých jsou spuštěné úlohy.
Vysvětlení dostupných typů výpočetních prostředků
Azure Machine Učení podporuje několik typů výpočetních prostředků pro experimentování, trénování a nasazení. Pokud máte více typů výpočetních prostředků, můžete pro své potřeby vybrat nejvhodnější typ cílového výpočetního objektu.
- Výpočetní instance: Chová se podobně jako virtuální počítač a primárně se používá ke spouštění poznámkových bloků. Je ideální pro experimentování.
- Výpočetní clustery: Clustery s více uzly virtuálních počítačů, které automaticky vertikálně navyšují nebo sníží kapacitu podle poptávky. Nákladově efektivní způsob spouštění skriptů, které potřebují zpracovávat velké objemy dat. Clustery také umožňují používat paralelní zpracování k distribuci úlohy a zkrátit dobu potřebnou ke spuštění skriptu.
- Clustery Kubernetes: Cluster založený na technologii Kubernetes a poskytuje větší kontrolu nad konfigurací a správou výpočetních prostředků. Cluster Azure Kubernetes (AKS) pro cloudové výpočetní prostředky můžete připojit k vlastnímu clusteru Azure Kubernetes nebo cluster Arc Kubernetes pro místní úlohy.
- Připojené výpočetní prostředky: Umožňuje připojit existující výpočetní prostředky, jako jsou virtuální počítače Azure nebo clustery Azure Databricks, k vašemu pracovnímu prostoru.
- Bezserverové výpočetní prostředky: Plně spravovaný výpočetní výkon na vyžádání, který můžete použít pro trénovací úlohy.
Poznámka:
Azure Machine Učení nabízí možnost vytvářet a spravovat vlastní výpočetní prostředky nebo používat výpočetní prostředky, které jsou plně spravované službou Azure Machine Učení.
Kdy použít jaký typ výpočetních prostředků?
Obecně platí, že při práci s cílovými výpočetními objekty můžete postupovat podle některých osvědčených postupů. Abyste pochopili, jak zvolit vhodný typ výpočetních prostředků, najdete několik příkladů. Mějte na paměti, že typ výpočetních prostředků, který používáte, vždy závisí na konkrétní situaci.
Volba cílového výpočetního objektu pro experimentování
Představte si, že jste datový vědec a budete požádáni o vývoj nového modelu strojového učení. Pravděpodobně máte malou podmnožinu trénovacích dat, se kterými můžete experimentovat.
Během experimentování a vývoje dáváte přednost práci v poznámkovém bloku Jupyter. Prostředí poznámkového bloku využívá většinu výpočetních prostředků, které běží nepřetržitě.
Mnozí datoví vědci znají spouštění poznámkových bloků na místním zařízení. Cloudová alternativa spravovaná službou Azure Machine Učení je výpočetní instance. Pokud chcete využít distribuovaný výpočetní výkon Sparku, můžete se také rozhodnout pro bezserverové výpočetní prostředky Sparku, abyste mohli spouštět kód Sparku v poznámkových blocích.
Volba cílového výpočetního prostředí pro produkční prostředí
Po experimentování můžete modely trénovat spuštěním skriptů Pythonu pro přípravu na produkční prostředí. Skripty budou snazší automatizovat a plánovat, kdy chcete model průběžně trénovat. Skripty můžete spouštět jako úlohy kanálu.
Při přechodu do produkčního prostředí chcete, aby byl cílový výpočetní objekt připravený ke zpracování velkých objemů dat. Čím více dat použijete, tím lépe bude model strojového učení pravděpodobně.
Při trénování modelů pomocí skriptů chcete cílový výpočetní objekt na vyžádání. Výpočetní cluster se automaticky škáluje, když se skripty musí spustit, a po dokončení provádění skriptu se vertikálně sníží kapacitu. Pokud chcete alternativu, kterou nemusíte vytvářet a spravovat, můžete použít výpočetní prostředky bezserverové služby Azure Machine Učení.
Volba cílového výpočetního prostředí pro nasazení
Typ výpočetních prostředků, který potřebujete při použití modelu ke generování předpovědí, závisí na tom, jestli chcete dávkové nebo předpovědi v reálném čase.
V případě dávkových predikcí můžete spustit úlohu kanálu v Učení Azure Machine. Cílové výpočetní objekty, jako jsou výpočetní clustery a bezserverové výpočetní prostředky azure Učení, jsou ideální pro úlohy kanálu, protože jsou na vyžádání a škálovatelné.
Pokud chcete predikce v reálném čase, potřebujete typ výpočetních prostředků, který běží nepřetržitě. Nasazení v reálném čase proto využívají odlehčeného (a nákladově efektivnějšího) výpočetního prostředí. Kontejnery jsou ideální pro nasazení v reálném čase. Když model nasadíte do spravovaného online koncového bodu, Azure Machine Učení vytvoří a spravuje kontejnery, které vám umožní model spustit. Případně můžete připojit clustery Kubernetes ke správě potřebných výpočetních prostředků pro generování předpovědí v reálném čase.