Machine Learning-Vorgänge

Artikel
07/19/2024

In diesem Artikel werden drei Azure-Architekturen für Machine Learning- Operations beschrieben, die durchgängige fortlaufende Integration und CI/CD-Pipelines (Continuous Delivery) und Umschulungspipelinen aufweisen. Die Architekturen sind für diese KI-Anwendungen:

Klassisches maschinelles Lernen
Maschinelles Sehen (CV)
Verarbeitung natürlicher Sprache

Diese Architekturen sind das Produkt des MLOps v2-Projekts. Sie beinhalten bewährte Methoden, die Lösungsarchitekten im Entwicklungsprozess verschiedener Lösungen für maschinelles Lernen identifiziert haben. Das Ergebnis ist verfügbar, wiederholbar und wartbares Muster. Alle drei Architekturen verwenden den Azure Machine Learning-Dienst.

Eine Implementierung mit Beispielbereitstellungsvorlagen für MLOps v2 finden Sie unter Azure MLOps v2 GitHub-Repository.

Mögliche Anwendungsfälle

Klassisches maschinelles Lernen: Zeitreihenprognose, Regression und Klassifizierung in tabellarischen strukturierten Daten sind die häufigsten Anwendungsfälle in dieser Kategorie. Beispiele:
- Binäre und Multibeschriftungsklassifizierung
- Linear, Polynomial, Ridge, Lasso, Quantile und Bayesian-Regression
- ARIMA, autoregressive, SARIMA, VAR, SES, LSTM
CV: Das in diesem Artikel vorgestellte MLOps-Framework konzentriert sich hauptsächlich auf die CV-Anwendungsfälle der Segmentierung und Bildklassifizierung.
Verarbeitung natürlicher Sprachen: Sie können dieses MLOps-Framework verwenden, um Folgendes zu implementieren:
- Erkennung benannter Entitäten:
- Textklassifizierung
- Textgenerierung
- Stimmungsanalyse
- Sprachübersetzung
- Fragen und Antworten
- Zusammenfassung
- Satzerkennung
- Spracherkennung
- Satzteilmarkierung

KI-Simulationen, Deep Reinforcement Learning und andere Formen der KI werden in diesem Artikel nicht beschrieben.

MLOps als wichtiger Entwurfsbereich für KI-Workloads

Die Planung und Implementierung von MLOps und GenAIOps sind entscheidende Entwurfsbereiche für KI-Workloads in Azure. Informationen dazu, warum diese Workloads für maschinelles Lernen spezielle Operationen benötigen, finden Sie unter MLOps und GenAIOps für KI-Workloads in Azure im Azure Well-Architected Framework.

Aufbau

Das Architekturmuster MLOps v2 verfügt über vier hauptmodulare Komponenten oder Phasen des MLOps-Lebenszyklus:

Datenbestand
Verwaltung und Einrichtung
Modellentwicklung oder die innere Schleifenphase
Modellimplementierung oder die Phase der äußeren Schleife

Die vorhergehenden Komponenten, die Verbindungen zwischen ihnen und die typischen beteiligten Personas sind in allen MLOps v2-Szenarioarchitekturen Standard. Abweichungen in den Details der einzelnen Komponenten können je nach Szenario unterschiedlich sein.

Die Basisarchitektur für MLOps v2 für Machine Learning ist das klassische Machine Learning-Szenario für tabellarische Daten. Die CV- und NLP-Architekturen basieren auf dieser Basisarchitektur und ändern diese Basisarchitektur.

MLOps v2 behandelt die folgenden Architekturen, die in diesem Artikel beschrieben werden:

Klassische Azure Machine Learning-Architektur
CV-Architektur für Machine Learning
Architektur der logistischen Datenverarbeitung für maschinelles Lernen

Klassische Machine Learning-Architektur

Laden Sie eine Visio-Datei dieser Architektur herunter.

Workflow für die klassische Machine Learning-Architektur

Datenbestand

Diese Komponente veranschaulicht den Datenbestand der Organisation und potenzielle Datenquellen und -ziele für ein Data Science-Projekt. Datentechniker sind die primären Besitzer dieser Komponente des MLOps v2-Lebenszyklus. Die Azure-Datenplattformen in diesem Diagramm sind weder vollständig noch präskriptiv. Ein grünes Häkchen kennzeichnet die Datenquellen und -ziele, die empfohlene Best Practices darstellen, die auf dem Anwendungsfall des Kunden basieren.
Verwaltung und Einrichtung

Diese Komponente ist der erste Schritt in der MLOps v2-Lösungsbereitstellung. Es besteht aus allen Aufgaben im Zusammenhang mit der Erstellung und Verwaltung von Ressourcen und Rollen, die dem Projekt zugeordnet sind. Beispielsweise kann das Infrastrukturteam:
1. Projekt-Quellcode-Repositorys erstellen.
2. Verwenden Sie Bicep oder Terraform, um Machine Learning-Arbeitsbereiche zu erstellen.
3. Erstellen oder Ändern von Datasets und Computeressourcen für die Modellentwicklung und -bereitstellung.
4. Definieren von Projektteambenutzern, deren Rollen und Zugriffssteuerelementen für andere Ressourcen
5. Erstellen von CI/CD-Pipelines.
6. Erstellen Sie Überwachungskomponenten zum Sammeln und Erstellen von Warnungen für Modell- und Infrastrukturmetriken.
Die primäre Person, die mit dieser Phase in Verbindung steht, ist das Infrastrukturteam, aber eine Organisation kann auch Dateningenieure, Ingenieure für maschinelles Lernen oder Datenwissenschaftler haben.
Modellentwicklung (innere Schleifenphase)

Die innere Schleifenphase besteht aus seinem iterativen Data Science-Workflow, der innerhalb eines dedizierten und sicheren Machine Learning-Arbeitsbereichs fungiert. Das vorangehende Diagramm zeigt einen typischen Workflow. Der Prozess beginnt mit der Datenaufnahme, geht über explorative Datenanalyse, Experimente, Modellentwicklung und -bewertung und registriert dann ein Modell für den Produktionseinsatz. Diese modulare Komponente ist agnostisch und kann an den Prozess angepasst werden, den Ihr Data Science-Team zur Entwicklung von Modellen verwendet.

Personas, die dieser Phase zugeordnet sind, umfassen Datenwissenschaftler und Machine Learning-Techniker.
Machine Learning-Registrierungen

Nachdem das Data Science-Team ein Modell entwickelt hat, das es in der Produktion einsetzen kann, registriert es das Modell im Machine Learning-Arbeitsbereichsregister. CI-Pipelines, die entweder automatisch durch die Modellregistrierung oder durch die Genehmigung von Menschen in der Schleife ausgelöst werden, fördern das Modell und alle anderen Modellabhängigkeiten an die Modellbereitstellungsphase.

Personas, die dieser Phase zugeordnet sind, sind in der Regel Machine Learning-Techniker.
Modellimplementierung (äußere Schleifenphase)

Die Modellimplementierung oder äußere Schleifenphase besteht aus vorproduktivem Staging und Tests, der Produktionsbereitstellung und der Überwachung von Modell, Daten und Infrastruktur. Wenn das Modell die Kriterien der Organisation und des Anwendungsfalls erfüllt, fördern CD-Pipelines das Modell und die zugehörigen Assets durch Produktion, Überwachung und mögliche Neuschulung.

Personas, die dieser Phase zugeordnet sind, sind in erster Linie Machine Learning-Techniker.
Staging und Test

Die Staging- und Testphase variiert je nach Kundenpraxis. Diese Staging- und Testphase kann sich je nach Kundenpraktiken unterscheiden, umfasst in der Regel Vorgänge wie die Umschulung und Prüfung des Modellkandidaten auf Produktionsdaten, Testbereitstellungen für Endpunktleistung, Datenqualitätsprüfungen, Komponententests und verantwortungsvolle KI-Prüfungen für Modell- und Datenverzerrungen. Diese Phase erfolgt in einem oder mehreren dedizierten und sicheren Machine Learning-Arbeitsbereichen.
Produktionsbereitstellung

Nachdem ein Modell die Staging- und Testphase durchlaufen hat, können Machine-Learning-Ingenieure es mithilfe einer „Human-in-the-Loop“-Genehmigung in die Produktion überführen. Zu den Optionen für die Modellbereitstellung gehören ein verwalteter Batchendpunkt für Batchszenarien oder ein verwalteter Onlineendpunkt oder eine Kubernetes-Bereitstellung, die Azure Arc für Onlineszenarien nahezu in Echtzeit verwendet. Die Produktion erfolgt normalerweise in einem oder mehreren dedizierten und sicheren Machine-Learning-Arbeitsbereichen.
Überwachung

Ingenieure für maschinelles Lernen überwachen Komponenten in der Bereitstellung, beim Testen und in der Produktion, um Metriken im Zusammenhang mit Leistungsänderungen des Modells, der Daten und der Infrastruktur zu sammeln. Sie können diese Metriken verwenden, um Maßnahmen zu ergreifen. Modell- und Datenüberwachung können die Überprüfung auf Modell- und Datendrift, die Modellleistung für neue Daten und verantwortungsvolle KI-Probleme umfassen. Durch die Überwachung der Infrastruktur können langsame Endpunktreaktionen, unzureichende Rechenkapazität oder Netzwerkprobleme identifiziert werden.
Daten- und Modellüberwachung: Ereignisse und Aktionen

Basierend auf Modell- und Datenkriterien wie Metrikschwellenwerten oder Zeitplänen können automatisierte Auslöser und Benachrichtigungen entsprechende Maßnahmen implementieren. Ein Trigger kann z. B. ein Modell neu trainieren, um neue Produktionsdaten zu verwenden, und dann das Modell zum Staging und Testen für eine Vorproduktionsauswertung zurückführen und testen. Oder ein Modell- oder Datenproblem könnte eine Aktion auslösen, die einen Loopback zur Modellentwicklungsphase erfordert, wo Datenwissenschaftler das Problem untersuchen und möglicherweise ein neues Modell entwickeln können.
Infrastrukturüberwachung: Ereignisse und Aktionen

Automatisierte Auslöser und Benachrichtigungen können entsprechende Maßnahmen basierend auf Infrastrukturkriterien implementieren, wie z. B. einer Verzögerung der Endpunktantwort oder unzureichender Rechenleistung für die Bereitstellung. Automatische Auslöser und Benachrichtigungen können einen Loopback zur Einrichtungs- und Verwaltungsphase auslösen, wo das Infrastrukturteam das Problem untersuchen und ggf. die Rechen- und Netzwerkressourcen neu konfigurieren kann.

CV-Architektur für Machine Learning

Laden Sie eine Visio-Datei dieser Architektur herunter.

Workflow für die CV-Architektur

Die CV-Architektur für Machine Learning basiert auf der klassischen Machine Learning-Architektur, beinhaltet jedoch Änderungen, die insbesondere für überwachte CV-Szenarien gelten.

Datenbestand

Diese Komponente demonstriert den Datenbestand der Organisation und potenzielle Datenquellen und -ziele für ein Data Science-Projekt. Datentechniker sind die primären Besitzer dieser Komponente im MLOps v2-Lebenszyklus. Die Azure-Datenplattformen in diesem Diagramm sind weder vollständig noch präskriptiv. Bilder für CV-Szenarien können aus verschiedenen Datenquellen stammen. Zur Steigerung der Effizienz bei der Entwicklung und Bereitstellung von CV-Modellen mit Machine Learning empfehlen wir Azure Blob Storage und Azure Data Lake Storage.
Verwaltung und Einrichtung

Diese Komponente ist der erste Schritt in der MLOps v2-Bereitstellung. Es besteht aus allen Aufgaben im Zusammenhang mit der Erstellung und Verwaltung von Ressourcen und Rollen, die dem Projekt zugeordnet sind. Für CV-Szenarien ist die Verwaltung und Einrichtung der MLOps v2-Umgebung weitgehend identisch mit klassischem maschinellem Lernen, umfasst aber einen zusätzlichen Schritt. Das Infrastrukturteam verwendet das Bezeichnungsfeature von Machine Learning oder ein anderes Tool zum Erstellen von Bildbezeichnungen und Anmerkungsprojekten.
Modellentwicklung (innere Schleifenphase)

Das innere Schleifenphase besteht aus seinem iterativen Data Science-Workflow, der innerhalb eines dedizierten und sicheren Machine Learning-Arbeitsbereichs ausgeführt wird. Der Hauptunterschied zwischen diesem Workflow und dem klassischen Machine Learning-Szenario besteht darin, dass die Bildbezeichnung und Anmerkung eine wichtige Komponente dieser Entwicklungsschleife ist.
Machine Learning-Registrierungen

Nachdem das Data Science-Team ein Modell entwickelt hat, das es in der Produktion einsetzen kann, registriert es das Modell im Machine Learning-Arbeitsbereichsregister. CI-Pipelines, die automatisch durch die Modellregistrierung oder durch die Genehmigung von Menschen in der Schleife ausgelöst werden, fördern das Modell und alle anderen Modellabhängigkeiten an die Modellbereitstellungsphase.
Modellimplementierung (äußere Schleifenphase)

Die Modellimplementierung oder äußere Schleifenphase besteht aus vorproduktivem Staging und Tests, der Produktionsbereitstellung und der Überwachung von Modell, Daten und Infrastruktur. Wenn das Modell die Kriterien der Organisation und des Anwendungsfalls erfüllt, fördern CD-Pipelines das Modell und die zugehörigen Assets durch Produktion, Überwachung und mögliche Neuschulung.
Staging und Test

Die Staging- und Testphase variiert je nach Kundenpraxis. Diese Staging- und Testphase kann sich je nach Kundenpraktiken unterscheiden, umfasst in der Regel Vorgänge wie Testbereitstellungen, Datenqualitätsprüfungen, Komponententests und verantwortungsvolle KI-Prüfungen für Modell- und Datenverzerrungen. Bei CV-Szenarien müssen Machine Learning-Ingenieure den Modellkandidaten aufgrund von Ressourcen- und Zeitbeschränkungen nicht mit Produktionsdaten neu trainieren. Das Data Science-Team kann stattdessen Produktionsdaten für die Modellentwicklung verwenden. Das aus der Entwicklungsschleife registrierte Kandidatenmodell wird für die Produktion ausgewertet. Diese Phase erfolgt in einem oder mehreren dedizierten und sicheren Machine Learning-Arbeitsbereichen.
Produktionsbereitstellung

Nachdem ein Modell die Staging- und Testphase durchlaufen hat, können Machine-Learning-Ingenieure es mithilfe einer „Human-in-the-Loop“-Genehmigung in die Produktion überführen. Zu den Optionen für die Modellbereitstellung gehören ein verwalteter Batchendpunkt für Batchszenarien oder ein verwalteter Onlineendpunkt oder eine Kubernetes-Bereitstellung, die Azure Arc für Onlineszenarien nahezu in Echtzeit verwendet. Die Produktion erfolgt normalerweise in einem oder mehreren dedizierten und sicheren Machine-Learning-Arbeitsbereichen.
Überwachung

Ingenieure für maschinelles Lernen überwachen Komponenten in der Bereitstellung, beim Testen und in der Produktion, um Metriken im Zusammenhang mit Leistungsänderungen des Modells, der Daten und der Infrastruktur zu sammeln. Sie können diese Metriken verwenden, um Maßnahmen zu ergreifen. Modell- und Datenüberwachung kann die Überprüfung der Modellleistung auf neuen Bildern umfassen. Durch die Überwachung der Infrastruktur können langsame Endpunktreaktionen, unzureichende Rechenkapazität oder Netzwerkprobleme identifiziert werden.
Daten- und Modellüberwachung: Ereignisse und Aktionen

Die Daten- und Modellüberwachung und Ereignis- und Aktionsphasen von MLOps für linguistische Datenverarbeitung sind die wichtigsten Unterschiede zum klassischen maschinellen Lernen. Die automatisierte Neuschulung erfolgt in der Regel nicht in CV-Szenarien, wenn die Leistungsverschlechterung der Modellleistung bei neuen Bildern erkannt wird. In diesem Fall ist ein Human-in-the-Loop-Prozess erforderlich, um neue Textdaten für das Modell mit schlechter Leistung zu überprüfen und zu kommentieren. Die nächste Aktion geht häufig zurück zur Modellentwicklungsschleife, um das Modell mit den neuen Bildern zu aktualisieren.
Infrastrukturüberwachung: Ereignisse und Aktionen

Automatisierte Auslöser und Benachrichtigungen können entsprechende Maßnahmen basierend auf Infrastrukturkriterien implementieren, wie z. B. einer Verzögerung der Endpunktantwort oder unzureichender Rechenleistung für die Bereitstellung. Automatische Auslöser und Benachrichtigungen können einen Loopback zur Setup- und Administrationsphase auslösen, wo das Infrastrukturteam das Problem untersuchen und ggf. die Umgebung sowie die Rechen- und Netzwerkressourcen neu konfigurieren kann.

Architektur der logistischen Datenverarbeitung für maschinelles Lernen

Laden Sie eine Visio-Datei dieser Architektur herunter.

Workflow für die Architektur der linguistischen Datenverarbeitung.

Die Architektur der linguistischen Datenverarbeitung beim maschinellen Lernen basiert auf der klassischen Architektur des maschinellen Lernens, weist jedoch einige für NLP-Szenarien spezifische Modifikationen auf.

Datenbestand

Diese Komponente demonstriert den Datenbestand der Organisation und potenzielle Datenquellen und -ziele für ein Data Science-Projekt. Datentechniker sind die primären Besitzer dieser Komponente im MLOps v2-Lebenszyklus. Die Azure-Datenplattformen in diesem Diagramm sind weder vollständig noch präskriptiv. Ein grünes Häkchen kennzeichnet Quellen und Ziele, die empfohlene Best Practices darstellen, die auf dem Anwendungsfall des Kunden basieren.
Verwaltung und Einrichtung

Diese Komponente ist der erste Schritt in der MLOps v2-Bereitstellung. Es besteht aus allen Aufgaben im Zusammenhang mit der Erstellung und Verwaltung von Ressourcen und Rollen, die dem Projekt zugeordnet sind. Für Szenarien zur Verarbeitung natürlicher Sprache sind Verwaltung und Einrichtung der MLOps v2-Umgebung weitgehend identisch mit denen für klassisches maschinelles Lernen, allerdings mit einem zusätzlichen Schritt: Erstellen Sie Bildbeschriftungs- und Annotationsprojekte, indem Sie die Beschriftungsfunktion von Machine Learning oder einem anderen Tool verwenden.
Modellentwicklung (innere Schleifenphase)

Das innere Schleifenphase besteht aus seinem iterativen Data Science-Workflow, der innerhalb eines dedizierten und sicheren Machine Learning-Arbeitsbereichs ausgeführt wird. Die typische NLP-Modellentwicklungsschleife unterscheidet sich vom klassischen Szenario des maschinellen Lernens darin, dass die typischen Entwicklungsschritte für dieses Szenario Annotatoren für Sätze sowie Tokenisierung, Normalisierung und Einbettungen für Textdaten umfassen.
Machine Learning-Registrierungen

Nachdem das Data Science-Team ein Modell entwickelt hat, das es in der Produktion einsetzen kann, registriert es das Modell im Machine Learning-Arbeitsbereichsregister. CI-Pipelines, die automatisch durch die Modellregistrierung oder durch die Genehmigung von Menschen in der Schleife ausgelöst werden, fördern das Modell und alle anderen Modellabhängigkeiten an die Modellbereitstellungsphase.
Modellimplementierung (äußere Schleifenphase)

Die Modellimplementierung oder äußere Schleifenphase besteht aus vorproduktivem Staging und Tests, der Produktionsbereitstellung und der Überwachung von Modell, Daten und Infrastruktur. Wenn das Modell die Kriterien der Organisation und des Anwendungsfalls erfüllt, fördern CD-Pipelines das Modell und die zugehörigen Assets durch Produktion, Überwachung und mögliche Neuschulung.
Staging und Test

Die Staging- und Testphase variiert je nach Kundenpraxis. Diese Staging- und Testphase kann sich je nach Kundenpraktiken unterscheiden, umfasst in der Regel Vorgänge wie die Umschulung und Prüfung des Modellkandidaten auf Produktionsdaten, Testbereitstellungen für Endpunktleistung, Datenqualitätsprüfungen, Komponententests und verantwortungsvolle KI-Prüfungen für Modell- und Datenverzerrungen. Diese Phase erfolgt in einem oder mehreren dedizierten und sicheren Machine Learning-Arbeitsbereichen.
Produktionsbereitstellung

Nachdem ein Modell die Staging- und Testphase durchlaufen hat, können Machine-Learning-Ingenieure es mithilfe einer „Human-in-the-Loop“-Genehmigung in die Produktion überführen. Zu den Optionen für die Modellbereitstellung gehören ein verwalteter Batchendpunkt für Batchszenarien oder ein verwalteter Onlineendpunkt oder eine Kubernetes-Bereitstellung, die Azure Arc für Onlineszenarien nahezu in Echtzeit verwendet. Die Produktion erfolgt normalerweise in einem oder mehreren dedizierten und sicheren Machine-Learning-Arbeitsbereichen.
Überwachung

Ingenieure für maschinelles Lernen überwachen Komponenten in der Bereitstellung, beim Testen und in der Produktion, um Metriken im Zusammenhang mit Leistungsänderungen des Modells, der Daten und der Infrastruktur zu sammeln. Sie können diese Metriken verwenden, um Maßnahmen zu ergreifen. Modell- und Datenüberwachung können die Überprüfung auf Modell- und Datendrift, die Modellleistung für neue Daten und verantwortungsvolle KI-Probleme umfassen. Die Infrastrukturüberwachung kann Probleme wie langsame Endpunktantworten, unzureichende Berechnungskapazität oder Netzwerkprobleme identifizieren.
Daten- und Modellüberwachung: Ereignisse und Aktionen

Wie in der CV-Architektur sind die Daten- und Modellüberwachung und Ereignis- und Aktionsphasen von MLOps für linguistische Datenverarbeitung die wichtigsten Unterschiede zum klassischem maschinellem Lernen. Die automatisierte Neuschulung erfolgt in der Regel nicht in Szenarien für linguistische Datenverarbeitung, wenn die Leistungsverschlechterung der Modellleistung bei neuen Bildern erkannt wird. In diesem Fall ist ein Human-in-the-Loop-Prozess erforderlich, um neue Textdaten für das Modell mit schlechter Leistung zu überprüfen und zu kommentieren. Häufig besteht die nächste Aktion darin, zur Modellentwicklungsschleife zurückzukehren, um das Modell mit den neuen Textdaten zu aktualisieren.
Infrastrukturüberwachung: Ereignisse und Aktionen

Automatisierte Auslöser und Benachrichtigungen können entsprechende Maßnahmen basierend auf Infrastrukturkriterien implementieren, wie z. B. einer Verzögerung der Endpunktantwort oder unzureichender Rechenleistung für die Bereitstellung. Automatische Auslöser und Benachrichtigungen können einen Loopback zur Einrichtungs- und Verwaltungsphase auslösen, wo das Infrastrukturteam das Problem untersuchen und ggf. die Rechen- und Netzwerkressourcen neu konfigurieren kann.

Komponenten

Machine Learning ist ein Cloud-Dienst, mit dem Sie Machine-Learning-Modelle im großen Maßstab trainieren, bewerten, bereitstellen und verwalten können.
Azure Pipelines ist ein Build- und Testsystem, das auf Azure DevOps basiert und für die Erstellung und Freigabe von Pipelines verwendet wird. Azure Pipelines unterteilt diese Pipelines in logische Schritte, die als Aufgaben bezeichnet werden.
GitHub ist eine Codehostingplattform für Versionsverwaltung, Zusammenarbeit und CI/CD-Workflows.
Azure Arc ist eine Plattform, die Azure Resource Manager zum Verwalten von Azure-Ressourcen und lokalen Ressourcen verwendet. Die Ressourcen können virtuelle Computer, Kubernetes-Cluster und Datenbanken enthalten.
Kubernetes ist ein Open-Source-System, mit dem Sie die Bereitstellung, Skalierung und Verwaltung von Containeranwendungen automatisieren können.
Azure Data Lake Storage ist ein Hadoop-kompatibles Dateisystem. Es verfügt über einen integrierten hierarchischen Namespace und die enorme Staffelung und Wirtschaftlichkeit von Azure Blob Storage.
Azure Synapse Analytics ist ein unbegrenzter Analysedienst, der Datenintegration, Data Warehousing für Unternehmen und Big Data-Analysen vereint.
Azure Event Hubs ist ein Dienst, der von Clientanwendungen generierte Datenströme aufnimmt. Anschließend erfassen und speichern sie Streamingdaten, die die Abfolge der empfangenen Ereignisse beibehalten. Consumer können eine Verbindung mit den Hubendpunkten herstellen, um Nachrichten zur Verarbeitung abzurufen. Diese Architektur verwendet die Data Lake Storage-Integration.

Andere Aspekte

Das vorangehende MLOps v2-Architekturmuster verfügt über mehrere wichtige Komponenten, einschließlich rollenbasierter Zugriffssteuerung (RBAC), die sich an die Geschäftsbeteiligten, die effiziente Paketverwaltung und robuste Überwachungsmechanismen richtet. Diese Komponenten tragen gemeinsam zur erfolgreichen Implementierung und Verwaltung von Machine Learning-Workflows bei.

Persona-basiertes RBAC

Es ist entscheidend, dass Sie den Zugriff auf Machine Learning-Daten und -Ressourcen verwalten. RBAC bietet ein robustes Framework, mit dem Sie verwalten können, wer bestimmte Aktionen ausführen und auf bestimmte Bereiche in Ihrer Lösung zugreifen kann. Entwerfen Sie Ihre Identitätssegmentierungsstrategie so, dass sie mit dem Lebenszyklus von Machine Learning-Modellen in Machine Learning und den im Prozess enthaltenen Personas übereinstimmt. Jede Persona verfügt über einen bestimmten Satz von Zuständigkeiten, die in ihren RBAC-Rollen und der Gruppenmitgliedschaft widerspiegelt werden.

Beispielpersonas

Um die entsprechende Segmentierung in einer Machine Learning-Workload zu unterstützen, berücksichtigen Sie die folgenden allgemeinen Personas, die den identitätsbasierten RBAC-Gruppenentwurf informieren.

Data Scientist und Ingenieur für maschinelles Lernen

Data Scientists und Machine Learning Ingenieure führen verschiedene Machine Learning- und Data Science-Aktivitäten im gesamten Softwareentwicklungslebenszyklus eines Projekts durch. Zu ihren Aufgaben gehören explorative Datenanalyse und Datenvorverarbeitung. Data Scientists und Machine Learning Ingenieure sind für Schulungen, Auswertungen und Bereitstellungsmodelle verantwortlich. Die Zuständigkeiten dieser Rollen umfassen auch Break-Fix-Aktivitäten für Machine Learning-Modelle, Pakete und Daten. Diese Aufgaben liegen außerhalb des Umfangs des technischen Supportteams der Plattform.