Delen via


Machine Learning-registers voor MLOps

In dit artikel wordt beschreven hoe Machine Learning-assets van machine learning loskoppelen van werkruimten, zodat u MLOps kunt gebruiken in ontwikkel-, test- en productieomgevingen. Uw omgevingen kunnen variëren op basis van de complexiteit van uw IT-systemen. De volgende factoren zijn van invloed op het aantal en het type omgeving dat u nodig hebt:

  • Beveiligings- en nalevingsbeleid. Productieomgevingen moeten mogelijk worden geïsoleerd van ontwikkelomgevingen in termen van toegangsbeheer, netwerkarchitectuur en gegevensblootstelling.
  • Abonnementen. Ontwikkelomgevingen en productieomgevingen maken vaak gebruik van afzonderlijke abonnementen voor facturering, budgettering en kostenbeheer.
  • Contreien. Mogelijk moet u implementeren in verschillende Azure-regio's ter ondersteuning van latentie- en redundantievereisten.

In de voorgaande scenario's kunt u verschillende Azure Machine Learning-werkruimten gebruiken voor ontwikkeling, testen en productie. Deze configuratie biedt de volgende potentiële uitdagingen voor modeltraining en -implementatie:

  • Mogelijk moet u een model trainen in een ontwikkelwerkruimte, maar dit implementeren op een eindpunt in een productiewerkruimte, mogelijk in een ander Azure-abonnement of -regio. In dit geval moet u de trainingstaak kunnen traceren. Als u bijvoorbeeld nauwkeurigheid of prestatieproblemen ondervindt met de productie-implementatie, moet u de metrische gegevens, logboeken, code, omgeving en gegevens analyseren die u hebt gebruikt om het model te trainen.

  • Mogelijk moet u een trainingspijplijn ontwikkelen met testgegevens of geanonimiseerde gegevens in de ontwikkelwerkruimte, maar het model opnieuw trainen met productiegegevens in de productiewerkruimte. In dit geval moet u mogelijk metrische trainingsgegevens vergelijken op voorbeeldgegevens versus productiegegevens om ervoor te zorgen dat de trainingsoptimalisaties goed presteren met werkelijke gegevens.

MLOps voor meerdere werkruimten met registers

Een register, net als een Git-opslagplaats, koppelt machine learning-assets los van werkruimten en host de assets op een centrale locatie, waardoor deze beschikbaar worden gemaakt voor alle werkruimten in uw organisatie. U kunt registers gebruiken om assets op te slaan en te delen, zoals modellen, omgevingen, onderdelen en gegevenssets.

Als u modellen in ontwikkelings-, test- en productieomgevingen wilt promoten, kunt u beginnen met het iteratief ontwikkelen van een model in de ontwikkelomgeving. Wanneer u een goed kandidaatmodel hebt, kunt u het publiceren naar een register. Vervolgens kunt u het model vanuit het register implementeren naar eindpunten in verschillende werkruimten.

Tip

Als u al modellen hebt geregistreerd in een werkruimte, kunt u de modellen promoveren naar een register. U kunt een model ook rechtstreeks in een register registreren vanuit de uitvoer van een trainingstaak.

Als u een pijplijn in één werkruimte wilt ontwikkelen en deze vervolgens in andere werkruimten wilt uitvoeren, registreert u eerst de onderdelen en omgevingen die de bouwstenen van de pijplijn vormen. Wanneer u de pijplijntaak verzendt, bepalen de reken- en trainingsgegevens, die uniek zijn voor elke werkruimte, de werkruimte waarin moet worden uitgevoerd.

In het volgende diagram ziet u de promotie van de trainingspijplijn tussen verkennende werkruimten en ontwikkelingswerkruimten en vervolgens de modelpromotie getraind om te testen en te produceren.

Diagram van pijplijn- en modelgebruik in omgevingen.

Volgende stappen