Verstehen des Geschäftsproblems

Abgeschlossen

Sie arbeiten bei Proseware, einem jungen Startup, das sich die Verbesserung der Gesundheitsversorgung zum Ziel gesetzt hat. Gemeinsam mit dem Data Science-Team haben Sie kürzlich die Arbeit an der Operationalisierung eines Diabetes-Klassifizierungsmodells abgeschlossen. Mit anderen Worten: Sie haben Notebooks in Skripts konvertiert, die Sie als Azure Machine Learning-Auftrag ausführen können.

Während einer Präsentation der End-to-End-Lösung vor den geschäftlichen und technischen Projektbeteiligten bei Proseware kamen verschiedene Fragen zur Skalierung der Modellanwendung auf, sowohl in Bezug auf den Aufbau des Modells als auch in Bezug auf dessen Nutzung.

Im Gesundheitswesen greifen viele Modelle auf medizinische Daten von Patienten zurück, um Krankheiten vorherzusagen. Aus früheren Projekten haben wir gelernt, dass diese Modelle oft stark vom geografischen Standort der Bevölkerungsgruppe abhängen, für die das Modell trainiert wird. Um dieses Modell skalierbar zu machen, müssen wir sicherstellen, dass verschiedene Versionen des Modells automatisch auf der Grundlage verschiedener Datensegmente trainiert werden können.

In der Besprechung haben die geschäftlichen und technischen Projektbeteiligten beschlossen, eine MLOps-Strategie (Machine Learning Operations) zu implementieren, um Modelle schnell erstellen, aktualisieren und bereitstellen zu können – wie z. B. das Klassifizierungsmodell, das das Data Science-Team für die Arzt-Web-App entwickelt hat.

Da Proseware für die Versionsverwaltung seines Codes GitHub nutzt, wurde die Entscheidung getroffen, GitHub Actions als Automatisierungskomponente der MLOps-Strategie einzusetzen.

Der erste Schritt bei der Implementierung des Automatisierungsprozesses besteht darin, eine GitHub-Aktion zu entwickeln, um das Diabetes-Klassifizierungsmodell mithilfe von Azure Machine Learning-Aufträgen zu trainieren.

Um die GitHub-Aktion zum Auslösen des Modelltrainings mit Azure Machine Learning Compute zu erstellen, müssen Sie Folgendes tun:

  • Erstellen eines Dienstprinzipals mithilfe der Azure CLI
  • Speichern der Anmeldeinformationen des Dienstprinzipals als Geheimnis in GitHub.
  • Erstellen einer GitHub-Aktion zum Trainieren des Modells mithilfe von Azure Machine Learning Compute