Kenniscontrole

Voltooid

Notitie

Lees de casestudy om deze oefening te voltooien. Aan het einde wordt u gevraagd om advies te geven door de vragen over de kennistoets te beantwoorden.

Welkom bij Proseware! U bent ingehuurd als hoofdgegevenswetenschapper om ons te helpen bij het ontwerpen van een machine learning-implementatieoplossing.

Het probleem begrijpen

Schermopname van de mobiele toepassing voor het diagnosticeren van patiënten met diabetes.

Bij Proseware ontwikkelen we een mobiele toepassing waarmee artsen sneller ziekten bij patiënten kunnen diagnosticeren. Een arts kan de medische gegevens van de patiënt invoeren in de app om een diagnose voor de patiënt te krijgen.

Onze eerste geplande functie is dat de app de arts vertelt of de patiënt verder moet worden gescreend of behandeld voor diabetes.

We hebben al gegevens verzameld die correleren met diabetes, zoals het aantal zwangerschappen, leeftijd en body mass index (BMI). We hebben ook een team van gegevenswetenschappers die werken aan het trainen van een model dat kan classificeren of een patiënt waarschijnlijk diabetes heeft.

We hebben uw hulp nodig bij het bepalen hoe u het model naar productie kunt brengen.

We kijken uit naar uw advies over het ontwerpen van de MLOps-oplossing (Machine Learning Operations).

Houd rekening met de vereisten

  • Houd rekening met de omgevingen. Momenteel werken we in een klein team en bent u de enige data scientist die betrokken is. We willen zien of dit project succesvol is voordat we daadwerkelijk omhoog schalen en een groot team erbij betrekken.
  • Houd rekening met het model. Omdat het model wordt gebruikt om artsen te helpen, is nauwkeurigheid belangrijk voor ons. Het model mag alleen worden gebruikt wanneer we weten dat het werkt zoals verwacht.
  • Houd rekening met de gegevens. We beginnen klein en gebruiken meestal het geïmplementeerde model om onze toepassing te testen. De gegevens waarop het geïmplementeerde model voorspellingen genereert, mogen niet worden gebruikt om het model opnieuw te trainen, omdat het kan worden vooroordelen.
1.

Hoeveel Azure Machine Learning-werkruimten moet het team maken?

2.

Wanneer moeten we het model opnieuw trainen?