Verstehen des Geschäftsproblems
Stellen Sie sich vor, Sie sind Machine Learning-Techniker bei Proseware, einem jungen Start-up-Unternehmen, das an einer neuen App für das Gesundheitswesen arbeitet. Das von den Data Scientists erstellte Diabetesklassifizierungsmodell ist das erste Modell, das in die App integriert wird. Im Gespräch mit dem gesamten Team stellt sich heraus, dass mehrere Modelle in die Web-App integriert werden sollen.
Wenn sich das Diabetesklassifizierungsmodell als erfolgreich erweist, will Proseware weitere Machine Learning-Modelle integrieren, damit Ärzte Patienten schneller auf verschiedene Krankheiten untersuchen können. Bei jedem neuen Modell muss das Data-Science-Team die Möglichkeit haben, in einer sicheren Umgebung zu experimentieren. Sobald das neue Modell genau genug ist, um in die Web-App integriert zu werden, muss es getestet werden, bevor es für einen Endpunkt bereitgestellt wird, der von der Web-App aufgerufen wird.
Gemeinsam mit dem Team entscheiden Sie, dass es am besten ist, verschiedene Umgebungen zu verwenden:
- Entwicklung für Experimente.
- Staging für Tests.
- Produktion für die Bereitstellung des Modells auf dem Produktionsendpunkt.
Für jede Umgebung wird ein eigener Azure Machine Learning-Arbeitsbereich erstellt. Daten und Ressourcen werden durch die Trennung der einzelnen Arbeitsbereiche geschützt. So enthält beispielsweise der Arbeitsbereich für die Entwicklung keine personenbezogenen Daten von Patienten. Und die Data Scientists haben nur Zugriff auf den Entwicklungsarbeitsbereich, da sie nur eine Umgebung zum Experimentieren benötigen und keinen Zugriff auf den Produktionscode oder auf Produktionsressourcen brauchen.
Als Machine Learning-Techniker müssen Sie sicherstellen, dass die Entwicklungen der Data Scientists problemlos in andere Umgebungen verschoben werden können. Sobald ein neues Modell bereitgestellt werden kann, sollten Sie es in der Stagingumgebung trainieren und testen. Nachdem Sie den Code, das Modell und die Bereitstellung getestet haben, geht es darum, das Modell in der Produktionsumgebung bereitzustellen. Teile dieses Prozesses können zur Beschleunigung des Prozesses automatisiert werden.
Zur Verwendung von Umgebungen gehen Sie wie folgt vor:
- Erstellen Sie in Ihrem GitHub-Repository Umgebungen.
- Speichern Sie Anmeldeinformationen für die einzelnen Azure Machine Learning-Arbeitsbereiche in Form eines Umgebungsgeheimnisses in GitHub.
- Fügen Sie zur abgegrenzten Genehmigungerforderliche Reviewer zu Umgebungen hinzu.
- Verwenden Sie Umgebungen in Ihren GitHub Actions-Workflows.