Sdílet prostřednictvím


Azure Machine Learning jako datový produkt pro analýzy v cloudovém měřítku

Azure Machine Learning je integrovaná platforma pro správu životního cyklu strojového učení od začátku do konce, včetně pomoci s vytvářením, provozem a spotřebou modelů a pracovních postupů strojového učení. Mezi výhody služby patří:

  • Možnosti podporují tvůrce, aby zvýšili svou produktivitu tím, že jim pomáhají spravovat experimenty, přistupovat k datům, sledovat úlohy, ladit hyperparametry a automatizovat pracovní postupy.

  • Kapacita modelu, která se má vysvětlit, reprodukovat, auditovat a integrovat s DevOps, a navíc bohatý model řízení zabezpečení, může podporovat operátory, které splňují požadavky na zásady správného řízení a dodržování předpisů.

  • Možnosti odvozování spravovaných dat a robustní integrace s výpočetními a datovými službami Azure vám můžou pomoct zjednodušit využívání služby.

Azure Machine Learning pokrývá všechny aspekty životního cyklu datových věd. Zahrnuje úložiště dat a registraci datové sady pro nasazení modelu. Dá se použít pro jakýkoli druh strojového učení, od klasického strojového učení až po hluboké učení. Zahrnuje učení pod dohledem a bez dohledu. Bez ohledu na to, jestli dáváte přednost psaní pythonu, kódu R nebo použití možností nulového nebo nízkého kódu, jako je návrhář, můžete vytvářet, trénovat a sledovat přesné modely strojového učení a hlubokého učení v pracovním prostoru Azure Machine Learning.

Azure Machine Learning, platforma Azure a služby Azure AI můžou spolupracovat na správě životního cyklu strojového učení. Specialista strojového učení může používat Azure Synapse Analytics, Azure SQL Database nebo Microsoft Power BI k zahájení analýzy dat a přechodu na Azure Machine Learning pro vytváření prototypů, správu experimentování a zprovoznění. V cílových zónách Azure je možné službu Azure Machine Learning považovat za datový produkt.

Azure Machine Learning v cloudových analýzách

Základní vrstva cílové zóny Cloud Adoption Framework, cílové zóny pro cloudovou analytiku dat a konfigurace Azure Machine Learning poskytují odborníkům na strojové učení předem nakonfigurované prostředí, do kterého mohou opakovaně implementovat nové úlohy strojového učení nebo migrovat stávající úlohy. Tyto funkce můžou odborníkům na strojové učení pomoct získat větší flexibilitu a hodnotu pro svůj čas.

Následující principy návrhu mohou posloužit k implementaci výchozích zón Azure Machine Learning:

  • Akcelerovaný přístup k datům: Předkonfigurujte komponenty úložiště vstupní zóny jako úložiště dat v pracovním prostoru Azure Machine Learning.

  • Povolená spolupráce: Uspořádejte pracovní prostory podle projektu a centralizujte správu přístupu k prostředkům cílových zón, abyste podpořili odborníky na datové inženýrství, datovou vědu a strojové učení ke spolupráci.

  • zabezpečená implementace: jako výchozí pro každé nasazení, dodržujte osvědčené postupy a pro zabezpečení datových prostředků používejte izolaci sítě, identitu a správu přístupu.

  • samoobslužné služby: specialisté na strojové učení můžou získat větší flexibilitu a organizaci prozkoumáním možností nasazení nových projektových prostředků.

  • Oddělení oblastí mezi správou dat a spotřebou dat: Propojení identity je výchozím typem ověřování pro Azure Machine Learning a úložiště.

  • Rychlejší aplikace dat (zarovnaná se zdrojem): cílové zóny Azure Data Factory, Azure Synapse Analytics a Databricks lze předem nakonfigurovat tak, aby byly propojeny s Azure Machine Learning.

  • Pozorovatelnost: Centrální protokolování a referenční konfigurace můžou pomoct monitorovat prostředí.

Přehled implementace

Poznámka

Tato část doporučuje konfigurace specifické pro analýzy v cloudovém měřítku. Doplňuje dokumentaci ke službě Azure Machine Learning a osvědčené postupy architektury přechodu na cloud.

Organizace a nastavení pracovního prostoru

Můžete nasadit tolik pracovních prostorů strojového učení, kolik vaše úlohy vyžadují, a to pro každou z cílových zón, které nasazujete. Nastavení vám může pomoct následující doporučení:

  • Nasaďte alespoň jeden pracovní prostor strojového učení na jeden projekt.

  • V závislosti na životním cyklu projektu strojového učení nasaďte jeden vývojový pracovní prostor, abyste mohli prototypovat případy použití a prozkoumat data v rané fázi. Pro práci, která vyžaduje nepřetržité experimentování, testování a nasazování, zřizujte testovací a produkční prostředí.

  • Pokud je potřeba více prostředí pro vývojové, pracovní a produkční pracovní prostory v cílové zóně dat, doporučujeme vyhnout se duplikaci dat tím, že každé prostředí přejde do stejné produkční cílové zóny dat.

  • Další informace o uspořádání a nastavení prostředků služby Azure Machine Learning najdete v tématu Uspořádání a nastavení prostředí Azure Machine Learning.

Pro každou výchozí konfiguraci prostředků v cílové zóně dat se služba Azure Machine Learning nasadí ve vyhrazené skupině prostředků s následujícími konfiguracemi a závislými prostředky:

  • Azure Key Vault
  • Application Insights
  • Azure Container Registry
  • Pomocí služby Azure Machine Learning se připojte k účtu Azure Storage a ověřování založenému na identitě Microsoft Entra, abyste uživatelům pomohli připojit se k účtu.
  • Protokolování diagnostiky je nastaveno pro každý pracovní prostor a nakonfigurováno na centrální prostředek Log Analytics v podnikovém měřítku; to umožňuje centrálně analyzovat stav úloh a stav prostředků služby Azure Machine Learning v rámci i mezi cílovými zónami.
  • Podívejte se na Co je pracovní prostor Azure Machine Learning?, abyste se dozvěděli více o prostředcích a závislostech Azure Machine Learning.

Integrace se základními službami cílové zóny dat

Cílová zóna dat obsahuje výchozí sadu služeb nasazených ve vrstvě služeb platformy . Tyto základní služby je možné nakonfigurovat při nasazení služby Azure Machine Learning do cílové zóny dat.

  • Připojte pracovní prostory Azure Synapse Analytics nebo Databricks jako propojené služby k integraci dat a zpracování velkých objemů dat.

  • Ve výchozím nastavení se služby datového jezera zřizují v zóně pro ukládání dat a nasazení produktů Azure Machine Learning se dodávají s připojeními (úložišti dat), která jsou pro tyto úložišťové účty předem nakonfigurovaná.

Přehled analýzy datových produktů pro Azure Machine Learning

Síťové připojení

Sítě pro implementaci služby Azure Machine Learning v cílových zónách Azure jsou nastavené s osvědčenými postupy zabezpečení pro Azure Machine Learning a osvědčenými postupy pro sítě podle CAF . Mezi tyto osvědčené postupy patří následující konfigurace:

  • Azure Machine Learning a závislé prostředky jsou nakonfigurované tak, aby používaly koncové body služby Private Link.
  • Spravované výpočetní prostředky se nasazují jenom s privátními IP adresami.
  • Síťové připojení k úložišti veřejných imagí Služby Azure Machine Learning a partnerským službám, jako je Azure Artifacts, je možné nakonfigurovat na úrovni sítě.

Správa identit a přístupu

Zvažte následující doporučení pro správu identit uživatelů a přístupu pomocí služby Azure Machine Learning:

  • Úložiště dat ve službě Azure Machine Learning je možné nakonfigurovat tak, aby používala ověřování na základě přihlašovacích údajů nebo identit. Pokud používáte řízení přístupu a konfigurace data lake vAzure Data Lake Storage Gen2, nakonfigurujte úložiště dat tak, aby používala autentizaci založenou na identitě, které umožňuje službě Azure Machine Learning optimalizovat oprávnění pro přístup uživatelů k úložištím.

  • Skupiny Microsoft Entra slouží ke správě uživatelských oprávnění pro prostředky úložiště a strojového učení.

  • Azure Machine Learning může používat spravované identity přiřazené uživatelem pro řízení přístupu a omezit rozsah přístupu ke službě Azure Container Registry, Key Vault, Azure Storage a Application Insights.

  • Vytvořte spravované identity přiřazené uživatelem ke spravovaným výpočetním clusterům vytvořeným ve službě Azure Machine Learning.

Zřízení infrastruktury prostřednictvím samoobslužné služby

Samoobslužné služby je možné povolit a řídit pomocí zásad pro službu Azure Machine Learning. Následující tabulka uvádí sadu výchozích zásad při nasazování služby Azure Machine Learning. Další informace naleznete v vestavěných definicích zásad služby Azure Policy pro Azure Machine Learning.

Politika Typ Odkaz
Pracovní prostory služby Azure Machine Learning by měly používat Službu Azure Private Link. Vestavěný zobrazení na webu Azure Portal
Pracovní prostory služby Azure Machine Learning by měly používat spravované identity přiřazené uživatelem. Vestavěný zobrazení na webu Azure Portal
[Preview]: Konfigurace povolených registrů pro zadané výpočetní prostředí Azure Machine Learning Vestavěný zobrazení na webu Azure Portal
Nakonfigurujte pracovní prostory Azure Machine Learning s privátními koncovými body. Vestavěný zobrazení na webu Azure Portal
Nakonfigurujte výpočetní prostředky strojového učení tak, aby zakázaly místní metody ověřování. Vestavěný zobrazení na webu Azure Portal
Připojit-strojovéučenívýpočet-nastaveníscripty-vytvořitskript Vlastní cílové zóny (CAF) Zobrazit na GitHubu
Odepřít-machinelearning-hbiworkspace Vlastní (cílové zóny CAF) zobrazení na GitHubu
Odepřít veřejný přístup strojového učení, když je za VNetem Vlastní (cílové zóny CAF) zobrazení na GitHubu
Odepření strojového učení a AKS Vlastní (přistávací zóny CAF) zobrazení na GitHubu
Odepřít-machinelearningcompute-subnetid Vlastní (CAF přistávací zóny) Zobrazit na GitHubu
Odepřít-machinelearningcompute-vmsize Vlastní (výsadkové zóny CAF) Zobrazení na GitHubu
Odepření veřejného přístupu k portu pro vzdálené přihlášení ve výpočetním klastru strojového učení. Vlastní (cílové zóny CAF) zobrazení na GitHubu
Zamítnout škálování clusteru pro strojové učení Vlastní (přistávací zóny CAF) zobrazení na GitHubu

Doporučení pro správu prostředí

Přistávací zóny analytických dat v cloudovém měřítku nabízejí referenční implementaci pro opakovatelná nasazení, které vám pomohou nastavit spravovatelná a řiditelná prostředí. Zvažte následující doporučení pro použití služby Azure Machine Learning ke správě prostředí:

  • Pomocí skupin Microsoft Entra můžete spravovat přístup k prostředkům strojového učení.

  • Publikujte řídicí panel centrálního monitorování pro monitorování stavu kanálu, využití výpočetních prostředků a správu kvót pro strojové učení.

  • Pokud tradičně používáte předdefinované zásady Azure a potřebujete splnit další požadavky na dodržování předpisů, vytvořte vlastní zásady Azure pro vylepšení zásad správného řízení a samoobslužných služeb.

  • Pokud chcete sledovat náklady na výzkum a vývoj, nasaďte jeden pracovní prostor strojového učení do cílové zóny jako sdílený prostředek během prvních fází zkoumání případu použití.

Důležitý

Clustery Azure Machine Learning slouží k trénování modelů na produkční úrovni a azure Kubernetes Service (AKS) pro nasazení na produkční úrovni.

Spropitné

Azure Machine Learning můžete použít pro projekty datových věd. Zahrnuje kompletní pracovní postup s dílčími službami a funkcemi a umožňuje plně automatizovat proces.

Další kroky

Využijte šablonu Analytika datových produktů a pokyny k nasazení služby Azure Machine Learning a odkaz na dokumentaci a kurzy Azure Machine Learning, abyste mohli začít tvořit svá řešení.

Pokračujte v následujících čtyřech článcích o architekturách přechodu na cloud a získejte další informace o osvědčených postupech pro nasazení a správu služby Azure Machine Learning pro podniky: