Sdílet prostřednictvím


Materiály pro trénování Azure v Tvůrci modelů

Následuje průvodce, který vám pomůže získat další informace o prostředcích používaných k trénování modelů v Azure pomocí Tvůrce modelů.

Co je experiment služby Azure Machine Learning?

Experiment služby Azure Machine Learning je prostředek, který je potřeba vytvořit před spuštěním trénování Model Builderu v Azure.

Experiment zapouzdřuje konfiguraci a výsledky pro jedno nebo více trénovacích běhů strojového učení. Experimenty patří do určitého pracovního prostoru. Při prvním vytvoření experimentu se jeho název zaregistruje v pracovním prostoru. Všechna následná spuštění – pokud se použije stejný název experimentu – se protokolují jako součást stejného experimentu. V opačném případě se vytvoří nový experiment.

Co je pracovní prostor Azure Machine Learning?

Pracovní prostor je prostředek služby Azure Machine Learning, který poskytuje centrální místo pro všechny prostředky a artefakty Azure Machine Learning vytvořené v rámci trénovacího spuštění.

K vytvoření pracovního prostoru Azure Machine Learning jsou potřeba následující:

  • Název: Název pracovního prostoru mezi 3 až 33 znaky. Názvy mohou obsahovat pouze alfanumerické znaky a pomlčky.
  • Oblast: Zeměpisné umístění datového centra, do kterého se nasazují vaše pracovní prostory a prostředky. Doporučujeme zvolit umístění blízko místa, kde jste vy nebo vaši zákazníci.
  • Skupina prostředků: Kontejner, který obsahuje všechny související prostředky pro řešení Azure.

Co je výpočetní prostředí Azure Machine Learning?

Výpočetní prostředí Azure Machine Learning je cloudový virtuální počítač s Linuxem, který se používá k trénování.

K vytvoření výpočetních prostředků služby Azure Machine Learning se vyžadují následující hodnoty:

  • Název: Název výpočetních prostředků mezi 2 až 16 znaky. Názvy mohou obsahovat pouze alfanumerické znaky a pomlčky.

  • Velikost výpočetních prostředků

    Tvůrce modelů může použít jeden z následujících výpočetních typů optimalizovaných pro GPU:

    Velikost vCPU Paměť: GiB Dočasné úložiště (SSD) GiB GPU Paměť GPU: GiB Maximální počet datových disků Maximální počet síťových adaptérů
    Standard_NC12 12 112 680 2 24 48 2
    Standard_NC24 24 224 1440 4 48 64 4

    Další podrobnosti o výpočetních typech optimalizovaných pro GPU najdete v dokumentaci k virtuálním počítačům řady NC-series s Linuxem.

  • Priorita výpočetních prostředků

    • Nízká priorita: Vhodné pro úlohy s kratší dobou provádění. Úkoly můžou být ovlivněné přerušením a nedostatkem dostupnosti. Tato možnost obvykle stojí méně, protože využívá nadbytečnou kapacitu v Azure.
    • Vyhrazeno: Hodí se pro úkoly libovolné doby trvání, ale zejména pro dlouhotrvající úlohy. Úkoly nejsou ovlivněny přerušením nebo nedostatkem dostupnosti. Tato možnost obvykle stojí více, protože pro vaše úkoly si vyhrazuje vyhrazenou sadu výpočetních prostředků v Azure.

Školení

Trénování v Azure je k dispozici pouze pro scénář klasifikace obrázků v Tvůrci modelů. Algoritmus použitý k trénování těchto modelů je hloubková neurální síť založená na architektuře ResNet50. Proces trénování nějakou dobu trvá a doba se může lišit v závislosti na velikosti vybraného výpočetního objektu a množství dat. Průběh spuštění můžete sledovat tak, že v sadě Visual Studio vyberete odkaz Sledovat aktuální spuštění na webu Azure Portal.

Výsledky

Po dokončení trénování se do řešení přidají dva projekty s následujícími příponami:

  • consoleApp: Konzolová aplikace jazyka C#, která poskytuje počáteční kód pro sestavení kanálu předpovědi a vytváření předpovědí.

  • model: Aplikace C# .NET Standard, která obsahuje datové modely definující schéma vstupních a výstupních dat modelu a také následující prostředky:

    • bestModel.onnx: Serializovaná verze modelu ve formátu Open Neural Network Exchange (ONNX). ONNX je open source formát pro modely AI, které podporují interoperabilitu mezi architekturami, jako jsou ML.NET, PyTorch a TensorFlow.
    • bestModelMap.json: Seznam kategorií použitých při vytváření předpovědí pro mapování výstupu modelu na textovou kategorii.
    • MLModel.zip: Serializovaná verze kanálu predikce ML.NET, která používá serializovanou verzi modelu bestModel.onnx k vytváření předpovědí a mapování výstupů pomocí souboru bestModelMap.json.

Použití modelu strojového učení

Třídy a v projektu modelu definují schéma očekávaného vstupu a výstupu modelu.

Ve scénáři klasifikace obrázků obsahuje ModelInput dva sloupce:

  • ImageSource: Cesta řetězce umístění obrázku.
  • Label: Skutečná kategorie, do které image patří. Label se používá pouze jako vstup při trénování a při vytváření předpovědí není nutné je poskytovat.

ModelOutput obsahuje dva sloupce:

  • Prediction: Predikovaná kategorie obrázku.
  • Score: Seznam pravděpodobností pro všechny kategorie (nejvyšší patří do Prediction).

Řešení problémů

Nejde vytvořit výpočetní prostředky

Pokud během vytváření výpočetních prostředků Azure Machine Learning dojde k chybě, výpočetní prostředek může stále existovat v chybovém stavu. Pokud se pokusíte znovu vytvořit výpočetní prostředek se stejným názvem, operace selže. Pokud chcete tuto chybu opravit, proveďte jednu z těchto akcí:

  • Vytvoření nového výpočetního prostředí s jiným názvem
  • Přejděte na web Azure Portal a odeberte původní výpočetní prostředek.