Verstehen des Geschäftsproblems
Proseware ist ein junges Start-up, das das Gesundheitswesen verbessern möchte. Ein Team bei Proseware arbeitet an einer neuen Webanwendung, mit der medizinische Fachkräfte Patient*innen schneller diagnostizieren können. Forschungsergebnisse haben gezeigt, dass Diabetes eine der am häufigsten diagnostizierten Krankheiten ist, die leicht erkannt werden kann, wenn in den medizinischen Daten eines Patienten bzw. einer Patientin ein bestimmtes Muster auftritt.
Im Rahmen der Veröffentlichung der neuen Web-App für medizinische Fachkräfte, die bei der Diagnose von Patient*innen helfen soll, wird als erstes Feature der Diabetesdetektor eingeführt. Mit diesem Feature kann eine medizinische Fachkraft die medizinischen Daten eines Patienten bzw. einer Patientin erfassen, sie in die App einspeisen und ermitteln, ob der*die Patient*in mit hoher Wahrscheinlichkeit an Diabetes erkrankt ist oder nicht. Die medizinischen Fachkräfte können diese Erkenntnisse in Verbindung mit ihrem Fachwissen nutzen, um Patient*innen zum weiteren Vorgehen zu beraten.
Das Data Science-Team hat ein Klassifizierungsmodell erstellt, das anhand anonymisierter Daten genau vorhersagt, ob eine Person Diabetes hat oder nicht. Das Modelltraining wird in einem Jupyter-Notebook definiert. Nun müssen Sie als Fachkraft für maschinelles Lernen die Arbeit des Data Science-Teams für die Produktion nutzbar machen.
So operationalisieren Sie das Modell:
- Konvertieren Sie das Modelltraining in eine robuste und reproduzierbare Pipeline.
- Testen Sie den Code und das Modell in einer Entwicklungsumgebung.
- Stellen Sie das Modell in einer Produktionsumgebung bereit.
- Automatisieren Sie den gesamten Prozess.
Jupyter-Notebooks eignen sich zwar ideal für Experimente, sollten jedoch nicht für Produktionsworkloads verwendet werden. Ihre erste Aufgabe besteht darin, die Notebooks in Skripte zu konvertieren und das Modelltraining als Azure Machine Learning-Auftrag auszuführen, damit der Workflow einfach ausgelöst und automatisiert werden kann.