Erkunden der Lösungsarchitektur

Abgeschlossen

Lernen Sie zum besseren Verständnis aller Voraussetzungen zunächst die Architektur besser kennen. Damit das Modell in der Produktion bereitgestellt werden kann, müssen Sie Ihre Lösung skalieren und mit anderen Teams zusammenarbeiten. Gemeinsam mit den wissenschaftlichen und technischen Fachkräften für Daten sowie dem Infrastrukturteam haben Sie sich für die folgende Vorgehensweise entschieden:

  • Alle Daten werden in Azure Blob Storage gespeichert und vom Data Engineer-Team verwaltet.
  • Das Infrastrukturteam erstellt die erforderlichen Azure-Ressourcen, wie z. B. den Azure Machine Learning-Arbeitsbereich.
  • Das Data Science-Team konzentriert sich auf die innere Schleife, die aus dem Entwickeln und Trainieren des Modells besteht.
  • Das Machine Learning-Team stellt das trainierte Modell in der äußeren Schleife bereit.

In Zusammenarbeit mit dem gewachsenen Team haben Sie eine Architektur für Machine Learning-Vorgänge (Machine Learning Operations, MLOps) entworfen.

Diagramm: Architektur für Machine Learning-Vorgänge

Hinweis

Das Diagramm zeigt eine vereinfachte Darstellung einer MLOps-Architektur. Eine detailliertere Beschreibung der Architektur finden Sie in den Anwendungsfällen im Solution Accelerator für MLOps (v2).

Das Hauptziel der MLOps-Architektur besteht in der Erstellung einer stabilen und reproduzierbaren Lösung. Zu diesem Zweck umfasst die Architektur folgende Elemente:

  1. Setup: Erstellen aller erforderlichen Azure-Ressourcen für die Lösung.
  2. Modellentwicklung (innere Schleife): Untersuchen und Verarbeiten der Daten zum Trainieren und Auswerten des Modells.
  3. Continuous Integration: Packen und Registrieren des Modells.
  4. Modellbereitstellung (äußere Schleife): Bereitstellen des Modells.
  5. Continuous Deployment: Testen des Modells und Höherstufen in die Produktionsumgebung.
  6. Überwachung: Überwachen der Modell- und Endpunktleistung.

An dieser Stelle des Projekts wird der Azure Machine Learning-Arbeitsbereich erstellt, die Daten werden in Azure Blob Storage gespeichert, und das Data Science-Team hat das Modell trainiert.

Sie möchten das Modell in der Produktion bereitstellen, um von der inneren Schleife der Modellentwicklung in die äußere Schleife überzugehen. Dazu müssen Sie die Ergebnisse des Data Science-Teams in eine stabile und reproduzierbare Pipeline in Azure Machine Learning umwandeln.

Stellen Sie sicher, dass der gesamte Code als Skripts gespeichert ist, und führen Sie die Skripts als Azure Machine Learning-Aufträge aus, um die Automatisierung des Modelltrainings und das erneute Trainieren des Modells in Zukunft zu vereinfachen.

Diagramm: Details der Modellentwicklung auf der Grundlage des Setups

Das Data Science-Team hat das Modell entwickelt. Sie erhalten ein Jupyter-Notebook mit den folgenden Aufgaben:

  1. Lesen und Untersuchen der Daten
  2. Führen Sie das Feature Engineering durch.
  3. Trainieren des Modells.
  4. Auswerten des Modells.

Während des Setups hat das Infrastrukturteam folgende Elemente erstellt:

  1. Einen Arbeitsbereich für die Azure Machine Learning-Entwicklung, der vom Data Science-Team zu Untersuchungs- und Experimentierzwecken genutzt werden kann.
  2. Eine Datenressource im Arbeitsbereich, die auf einen Ordner in Azure Blob Storage verweist, der die Daten enthält.
  3. Computeressourcen zum Ausführen von Notebooks und Skripts.

Ihre erste MLOps-Aufgabe besteht in der Umwandlung der Ergebnisse des Data Science-Teams zur Automatisierung der Modellentwicklung. Während das Data Science-Team in einem Jupyter-Notebook gearbeitet hat, müssen Sie Skripts verwenden und mithilfe von Azure Machine Learning-Aufträgen ausführen. Die Eingabe des Auftrags stellt die vom Infrastrukturteam erstellte Datenressource dar, die auf die Daten in der Azure Blob Storage-Instanz verweist. Diese ist mit dem Azure Machine Learning-Arbeitsbereich verbunden.