Registry služby Machine Learning pro MLOps
Tento článek popisuje, jak registry Azure Machine Learning oddělují prostředky strojového učení od pracovních prostorů a umožňují používat MLOps napříč vývojovými, testovacími a produkčními prostředími. Vaše prostředí se můžou lišit v závislosti na složitosti vašich IT systémů. Počet a typ potřebných prostředí ovlivňují následující faktory:
- Zásady zabezpečení a dodržování předpisů. Produkční prostředí může být potřeba izolovat od vývojových prostředí z hlediska řízení přístupu, síťové architektury a vystavení dat.
- Předplatná Vývojová prostředí a produkční prostředí často používají samostatná předplatná pro účely fakturace, rozpočtování a správy nákladů.
- Regiony. Možná budete muset nasadit do různých oblastí Azure, abyste podporovali požadavky na latenci a redundanci.
V předchozích scénářích můžete pro vývoj, testování a produkci použít různé pracovní prostory služby Azure Machine Learning. Tato konfigurace představuje následující potenciální výzvy při trénování a nasazení modelu:
Možná budete muset vytrénovat model ve vývojovém pracovním prostoru, ale nasadit ho do koncového bodu v produkčním pracovním prostoru, případně v jiném předplatném Nebo oblasti Azure. V takovém případě musíte být schopni trasovat úlohu trénování. Pokud například při produkčním nasazení narazíte na problémy s přesností nebo výkonem, musíte analyzovat metriky, protokoly, kód, prostředí a data, která jste použili k trénování modelu.
Možná budete muset vytvořit trénovací kanál s testovacími daty nebo anonymizovanými daty v pracovním prostoru pro vývoj, ale model znovu natrénovat s produkčními daty v produkčním pracovním prostoru. V takovém případě možná budete muset porovnat trénovací metriky u ukázkových a produkčních dat, abyste zajistili, že optimalizace trénování dobře fungují se skutečnými daty.
MlOps mezi pracovními prostory s registry
Registr, podobně jako úložiště Git, odděluje prostředky strojového učení od pracovních prostorů a hostuje prostředky v centrálním umístění a zpřístupňuje je všem pracovním prostorům ve vaší organizaci. Registry můžete použít k ukládání a sdílení prostředků, jako jsou modely, prostředí, komponenty a datové sady.
Pokud chcete propagovat modely napříč vývojovými, testovacími a produkčními prostředími, můžete začít iterativním vývojem modelu ve vývojovém prostředí. Pokud máte vhodný kandidátní model, můžete ho publikovat do registru. Model pak můžete nasadit z registru do koncových bodů v různých pracovních prostorech.
Tip
Pokud už máte modely zaregistrované v pracovním prostoru, můžete modely zvýšit na registr. Model můžete také zaregistrovat přímo v registru z výstupu trénovací úlohy.
Pokud chcete vytvořit kanál v jednom pracovním prostoru a pak ho spustit v jiných pracovních prostorech, začněte registrací komponent a prostředí, které tvoří stavební bloky kanálu. Když odešlete úlohu kanálu, výpočetní a trénovací data, která jsou jedinečná pro každý pracovní prostor, určete pracovní prostor, ve kterém se má spustit.
Následující diagram znázorňuje povýšení kanálu trénování mezi průzkumnými a vývojovými pracovními prostory a pak natrénovaným povýšení modelu pro testování a produkci.