Upgrade pracovních postupů ML na cílové modely v katalogu Unity
Tento článek vysvětluje, jak migrovat a upgradovat existující pracovní postupy Databricks, používat modely v katalogu Unity.
Požadavky
Požadovaná oprávnění
Pokud chcete spustit pracovní postup trénování, nasazení nebo inference modelu v katalogu Unity, musí mít hlavní subjekt spouštějící pracovní postup oprávnění USE CATALOG
a USE SCHEMA
ke katalogu a schématu, které tento model obsahují.
Vyžadují se také následující oprávnění:
- Pokud chcete vytvořit model, musí mít
CREATE MODEL
objekt zabezpečení oprávnění. - Pokud chcete načíst nebo nasadit model, musí mít
EXECUTE
objekt zabezpečení oprávnění k registrovanému modelu.
Následující akce může provést pouze vlastník zaregistrovaného modelu:
- Vytvořte novou verzi modelu.
- Nastavte alias u registrovaného modelu.
Požadavky na výpočetní prostředky
Výpočetní prostředek zadaný pro pracovní postup musí mít přístup ke katalogu Unity. Viz režimy Accessu.
Vytváření pracovních postupů paralelního trénování, nasazení a odvozování
Pokud chcete upgradovat pracovní postupy trénování a odvozování modelů na katalog Unity, databricks doporučuje přírůstkový přístup, ve kterém vytvoříte paralelní trénování, nasazení a odvozovací kanál, který využívá modely v katalogu Unity. Jakmile budete spokojeni s výsledky v Unity Catalogu, můžete přepnout podřízené uživatele na čtení výstupu dávkového zpracování nebo zvýšit množství provozu směrovaného do modelů v Unity Catalogu při poskytování koncových bodů.
Pracovní postup trénování modelu
Naklonujte pracovní postup trénování modelu. Ověřte, že instanční objekt, který spouští pracovní postup, a výpočetní prostředky zadané pro pracovní postup splňují požadavky.
Dále upravte trénovací kód modelu v naklonovaném pracovním postupu. Možná budete muset naklonovat poznámkový blok spuštěný pracovním postupem nebo vytvořit a cílit na novou větev Gitu v naklonovaném pracovním postupu. Podle těchto kroků nainstalujte potřebnou verzi MLflow a nakonfigurujte klienta tak, aby cílil na Unity Catalog ve vašem trénovacím kódu. Potom aktualizujte trénovací kód modelu tak, aby registrovali modely do katalogu Unity. Vizte Trénujte a registrujte modely kompatibilní s Unity katalogem.
Pracovní postup nasazení modelu
Naklonujte pracovní postup nasazení modelu. Ověřte, že instanční objekt, který spouští pracovní postup, a výpočetní prostředky zadané pro pracovní postup splňují požadavky.
Pokud máte v pracovním postupu nasazení logiku ověření modelu, aktualizujte ji tak, aby načítání verzí modelu z UC. Použití aliasů ke správě zavedení produkčního modelu
Pracovní postup odvozování modelů
Pracovní postup odvození služby Batch
Naklonujte pracovní postup odvozování dávky. Ověřte, že instanční objekt, který spouští pracovní postup, a výpočetní prostředky zadané pro pracovní postup splňují požadavky.
Pracovní postup obsluhy modelu
Pokud používáte obsluhu modelu Mosaic AI, nemusíte naklonovat stávající koncový bod. Místo toho použijte funkci rozdělení provozu k zahájení směrování malého zlomku provozu do modelů v katalogu Unity. Při kontrole výsledků pomocí katalogu Unity zvyšte objem provozu, dokud se veškerý provoz nepřesměruje.
Zvýšení úrovně modelu napříč prostředími
Podpora modelu napříč prostředími funguje s modely v katalogu Unity odlišně. Podrobnosti najdete v tématu Zvýšení úrovně modelu napříč prostředími.
Použití webhooků úloh k ručnímu schválení nasazení modelu
Databricks doporučuje v případě potřeby automatizovat nasazení modelu pomocí vhodných kontrol a testů během procesu nasazení modelu. Pokud ale potřebujete provést ruční schválení pro nasazení produkčních modelů, můžete pomocí oznámení úloh volat externí systémy CI/CD a požádat o ruční schválení pro nasazení modelu po úspěšném dokončení úlohy trénování modelu. Po poskytnutí ručního schválení může váš systém CI/CD nasadit verzi modelu, která bude obsluhovat provoz, například nastavením aliasu Šampion.