Het zakelijke probleem begrijpen
Stel dat u een machine learning-engineer bent bij Proseware, een jonge start-up die aan een nieuwe gezondheidszorg-app werkt. Het diabetesclassificatiemodel, gemaakt door de gegevenswetenschappers, is het eerste model dat met de app moet worden geïntegreerd. Nadat u met het grotere team hebt gepraat, blijkt dat het doel is om meerdere modellen te integreren met de web-app.
Wanneer het model voor diabetesclassificatie succesvol blijkt te zijn, wil Proseware meer machine learning-modellen toevoegen, zodat beoefenaars sneller patiënten kunnen diagnosticeren voor verschillende ziekten. Voor elk nieuw model moet het data science-team experimenteren in een veilige omgeving. Zodra het nieuwe model nauwkeurig genoeg is om te worden geïntegreerd met de web-app, moet het worden getest voordat het wordt geïmplementeerd op een eindpunt dat vanuit de web-app wordt aangeroepen.
Samen met het team besluit u dat u het beste verschillende omgevingen kunt gebruiken:
- Ontwikkeling voor experimenten.
- Fasering voor testen.
- Productie voor het implementeren van het model in het productie-eindpunt.
Voor elke omgeving maakt u een afzonderlijke Azure Machine Learning-werkruimte. Door de werkruimten gescheiden te houden voor elke omgeving, kunt u gegevens en resources beveiligen. De ontwikkelwerkruimte bevat bijvoorbeeld geen persoonlijke gegevens van patiënten. En de gegevenswetenschappers hebben alleen toegang tot de ontwikkelwerkruimte, omdat ze alleen een omgeving nodig hebben voor experimenten en geen toegang nodig hebben tot een van de productiecode of resources.
Als machine learning-engineer moet u ervoor zorgen dat de gegevenswetenschappers eenvoudig worden verplaatst tussen omgevingen. Zodra een nieuw model klaar is om te worden geïmplementeerd, wilt u dat het model wordt getraind en getest in de faseringsomgeving. Nadat u de code, het model en de implementatie hebt getest, wilt u het model implementeren in de productieomgeving. Onderdelen van dit proces kunnen worden geautomatiseerd om het proces te versnellen.
Als u wilt werken met omgevingen, wilt u het volgende doen:
- Maak omgevingen in uw GitHub-opslagplaats.
- Sla referenties op voor elke Azure Machine Learning-werkruimte als een omgevingsgeheim in GitHub.
- Voeg vereiste revisoren toe aan omgevingen voor goedkeuring door gated.
- Gebruik omgevingen in uw GitHub Actions-werkstromen.