Eksplorowanie architektury rozwiązania

Ukończone

Przed rozpoczęciem zapoznajmy się z architekturą, aby zrozumieć wszystkie wymagania. Przeniesienie modelu do środowiska produkcyjnego oznacza konieczność skalowania rozwiązania i współpracy z innymi zespołami. Wraz z analitykami danych, inżynierami danych i zespołem infrastruktury decydujesz się na użycie następującego podejścia:

  • Wszystkie dane będą przechowywane w usłudze Azure Blob Storage, która będzie zarządzana przez inżyniera danych.
  • Zespół infrastruktury utworzy niezbędne zasoby platformy Azure, takie jak obszar roboczy usługi Azure Machine Learning.
  • Analityk danych skupi się na pętli wewnętrznej: opracowywaniu i trenowaniu modelu.
  • Inżynier uczenia maszynowego przejmie wytrenowany model i wdroży go w pętli zewnętrznej.

Wraz z większym zespołem zaprojektowano architekturę w celu osiągnięcia operacji uczenia maszynowego (MLOps).

Diagram architektury operacji uczenia maszynowego.

Uwaga

Diagram jest uproszczoną reprezentacją architektury MLOps. Aby wyświetlić bardziej szczegółową architekturę, zapoznaj się z różnymi przypadkami użycia w akceleratorze rozwiązań MLOps (v2).

Głównym celem architektury MLOps jest utworzenie niezawodnego i powtarzalnego rozwiązania. Aby osiągnąć ten cel, architektura obejmuje następujące elementy:

  1. Konfiguracja: utwórz wszystkie niezbędne zasoby platformy Azure dla rozwiązania.
  2. Programowanie modelu (pętla wewnętrzna): Eksplorowanie i przetwarzanie danych w celu trenowania i oceniania modelu.
  3. Ciągła integracja: pakowanie i rejestrowanie modelu.
  4. Wdrażanie modelu (pętla zewnętrzna): wdrażanie modelu.
  5. Ciągłe wdrażanie: przetestuj model i podwyższ poziom do środowiska produkcyjnego.
  6. Monitorowanie: Monitorowanie wydajności modelu i punktu końcowego.

W tym momencie w projekcie tworzony jest obszar roboczy usługi Azure Machine Learning, dane są przechowywane w usłudze Azure Blob Storage, a zespół ds. nauki o danych wytrenował model.

Chcesz przejść z wewnętrznej pętli i programowania modelu do pętli zewnętrznej przez wdrożenie modelu w środowisku produkcyjnym. W związku z tym należy przekonwertować dane wyjściowe zespołu nauki o danych na niezawodny i powtarzalny potok w usłudze Azure Machine Learning.

Zapewnienie, że cały kod jest przechowywany jako skrypty i wykonywanie skryptów, ponieważ zadania usługi Azure Machine Learning ułatwią automatyzację trenowania modelu i ponownego trenowania modelu w przyszłości.

Diagram przedstawiający szczegółowe informacje o tworzeniu modelu, który opiera się na konfiguracji.

Zespół ds. nauki o danych pracuje nad opracowywaniem modeli. Udostępniają notes Jupyter, który obejmuje następujące zadania:

  1. Odczytywanie i eksplorowanie danych.
  2. Wykonywanie inżynierii cech.
  3. Trenowanie modelu.
  4. Oceń model.

W ramach konfiguracji zespół ds. infrastruktury utworzył następujące elementy:

  1. Obszar roboczy programowania (deweloperskiego) usługi Azure Machine Learning, który może być używany przez zespół ds. nauki o danych do eksploracji i eksperymentowania.
  2. Zasób danych w obszarze roboczym, który odwołuje się do folderu w usłudze Azure Blob Storage, który zawiera dane.
  3. Zasoby obliczeniowe potrzebne do uruchamiania notesów i skryptów.

Pierwszym zadaniem metodyki MLOps jest przekonwertowanie pracy analityków danych, dzięki czemu można łatwo zautomatyzować tworzenie modelu. Podczas gdy zespół ds. nauki o danych pracował w notesie Jupyter, musisz użyć skryptów i wykonać je przy użyciu zadań usługi Azure Machine Learning. Dane wejściowe zadania to zasób danych utworzony przez zespół infrastruktury, który wskazuje dane znajdujące się w usłudze Azure Blob Storage połączone z obszarem roboczym usługi Azure Machine Learning.