Návrh pro opětovné natrénování
Při přípravě modelu na produkční prostředí v řešení operací strojového učení (MLOps) je potřeba navrhnout pro opětovné trénování.
Obecně platí, že při opětovném trénování modelu existují dva přístupy:
- Na základě plánu: Pokud víte, že vždy potřebujete nejnovější verzi modelu, můžete se rozhodnout model každý týden nebo každý měsíc přetrénovat podle plánu.
- Na základě metrik: Pokud chcete model v případě potřeby přetrénovat, můžete monitorovat výkon modelu a posun dat a rozhodnout se, kdy potřebujete model přetrénovat.
V obou případech je potřeba navrhnout přetrénování. Pokud chcete model snadno přetrénovat, měli byste kód připravit na automatizaci.
Příprava kódu
V ideálním případě byste měli modely trénovat pomocí skriptů místo poznámkových bloků. Skripty jsou vhodnější pro automatizaci. Do skriptu můžete přidat parametry a změnit vstupní parametry, jako jsou trénovací data nebo hodnoty hyperparametrů. Při parametrizaci skriptů můžete model v případě potřeby snadno přetrénovat na nová data.
Další důležitou věcí při přípravě kódu je hostování kódu v centrálním úložišti. Úložiště odkazuje na umístění, kde jsou uloženy všechny relevantní soubory projektu. S projekty strojového učení jsou úložiště založená na Gitu ideální pro dosažení správy zdrojového kódu.
Když na projekt použijete správu zdrojového kódu, můžete snadno spolupracovat na projektu. Pokud chcete model vylepšit, můžete ho přiřadit tak, že kód aktualizujete. Uvidíte předchozí změny a změny si můžete prohlédnout před jejich potvrzením do hlavního úložiště.
Automatizace kódu
Pokud chcete kód spustit automaticky, můžete nakonfigurovat úlohy azure machine Učení tak, aby spouštěly skripty. Ve službě Azure Machine Učení můžete také vytvářet a plánovat kanály pro spouštění skriptů.
Pokud chcete, aby se skripty spouštěly na základě triggeru nebo události, ke které dochází mimo službu Azure Machine Učení, můžete chtít aktivovat úlohu Učení azure z jiného nástroje.
Dva nástroje, které se běžně používají v projektech MLOps, jsou Azure DevOps a GitHub (Actions). Oba nástroje umožňují vytvářet kanály automatizace a můžou aktivovat kanály azure machine Učení.
Jako datový vědec můžete raději pracovat se sadou Azure Machine Učení Python SDK. Při práci s nástroji, jako jsou Azure DevOps a GitHub, ale možná budete chtít místo toho nakonfigurovat potřebné prostředky a úlohy s rozšířením Azure Machine Učení CLI. Rozhraní příkazového řádku Azure je navržené pro automatizaci úloh a může být jednodušší používat s Azure DevOps a GitHubem.
Tip
Pokud chcete získat další informace o MLOps, projděte si úvod do operací strojového učení (MLOps) nebo zkuste vytvořit první kanál automatizace MLOps pomocí GitHub Actions.