Sdílet prostřednictvím


Registry služby Machine Learning pro MLOps

Tento článek popisuje, jak registry Azure Machine Learning oddělují prostředky strojového učení od pracovních prostorů a umožňují používat MLOps napříč vývojovými, testovacími a produkčními prostředími. Vaše prostředí se můžou lišit v závislosti na složitosti vašich IT systémů. Počet a typ potřebných prostředí ovlivňují následující faktory:

  • Zásady zabezpečení a dodržování předpisů. Produkční prostředí může být potřeba izolovat od vývojových prostředí z hlediska řízení přístupu, síťové architektury a vystavení dat.
  • Předplatná Vývojová prostředí a produkční prostředí často používají samostatná předplatná pro účely fakturace, rozpočtování a správy nákladů.
  • Regiony. Možná budete muset nasadit do různých oblastí Azure, abyste podporovali požadavky na latenci a redundanci.

V předchozích scénářích můžete pro vývoj, testování a produkci použít různé pracovní prostory služby Azure Machine Learning. Tato konfigurace představuje následující potenciální výzvy při trénování a nasazení modelu:

  • Možná budete muset vytrénovat model ve vývojovém pracovním prostoru, ale nasadit ho do koncového bodu v produkčním pracovním prostoru, případně v jiném předplatném Nebo oblasti Azure. V takovém případě musíte být schopni trasovat úlohu trénování. Pokud například při produkčním nasazení narazíte na problémy s přesností nebo výkonem, musíte analyzovat metriky, protokoly, kód, prostředí a data, která jste použili k trénování modelu.

  • Možná budete muset vytvořit trénovací kanál s testovacími daty nebo anonymizovanými daty v pracovním prostoru pro vývoj, ale model znovu natrénovat s produkčními daty v produkčním pracovním prostoru. V takovém případě možná budete muset porovnat trénovací metriky u ukázkových a produkčních dat, abyste zajistili, že optimalizace trénování dobře fungují se skutečnými daty.

MlOps mezi pracovními prostory s registry

Registr, podobně jako úložiště Git, odděluje prostředky strojového učení od pracovních prostorů a hostuje prostředky v centrálním umístění a zpřístupňuje je všem pracovním prostorům ve vaší organizaci. Registry můžete použít k ukládání a sdílení prostředků, jako jsou modely, prostředí, komponenty a datové sady.

Pokud chcete propagovat modely napříč vývojovými, testovacími a produkčními prostředími, můžete začít iterativním vývojem modelu ve vývojovém prostředí. Pokud máte vhodný kandidátní model, můžete ho publikovat do registru. Model pak můžete nasadit z registru do koncových bodů v různých pracovních prostorech.

Tip

Pokud už máte modely zaregistrované v pracovním prostoru, můžete modely zvýšit na registr. Model můžete také zaregistrovat přímo v registru z výstupu trénovací úlohy.

Pokud chcete vytvořit kanál v jednom pracovním prostoru a pak ho spustit v jiných pracovních prostorech, začněte registrací komponent a prostředí, které tvoří stavební bloky kanálu. Když odešlete úlohu kanálu, výpočetní a trénovací data, která jsou jedinečná pro každý pracovní prostor, určete pracovní prostor, ve kterém se má spustit.

Následující diagram znázorňuje povýšení kanálu trénování mezi průzkumnými a vývojovými pracovními prostory a pak natrénovaným povýšení modelu pro testování a produkci.

Diagram využití kanálu a modelu napříč prostředími

Další kroky