Identyfikowanie zasobów usługi Azure Machine Learning

Ukończone

Zasoby w usłudze Azure Machine Learning odnoszą się do infrastruktury potrzebnej do uruchomienia przepływu pracy uczenia maszynowego. W idealnym przypadku chcesz, aby ktoś podobny do administratora utworzył zasoby i zarządzał nimi.

Zasoby w usłudze Azure Machine Learning obejmują:

  • Obszar roboczy
  • Zasoby obliczeniowe
  • Magazyny danych

Tworzenie obszaru roboczego i zarządzanie nim

Obszar roboczy to zasób najwyższego poziomu dla usługi Azure Machine Learning. Analitycy danych potrzebują dostępu do obszaru roboczego w celu trenowania i śledzenia modeli oraz wdrażania modeli w punktach końcowych.

Należy jednak zachować ostrożność, kto ma pełny dostęp do obszaru roboczego. Obok odwołań do zasobów obliczeniowych i magazynów danych można znaleźć wszystkie dzienniki, metryki, dane wyjściowe, modele i migawki kodu w obszarze roboczym.

Tworzenie zasobów obliczeniowych i zarządzanie nimi

Jednym z najważniejszych zasobów potrzebnych podczas trenowania lub wdrażania modelu jest obliczanie. W obszarze roboczym usługi Azure Machine Learning istnieje pięć typów zasobów obliczeniowych:

  • Wystąpienia obliczeniowe: podobnie jak maszyna wirtualna w chmurze zarządzana przez obszar roboczy. Idealny do użycia jako środowisko programistyczne do uruchamiania notesów (Jupyter).
  • Klastry obliczeniowe: klastry na żądanie węzłów obliczeniowych procesora CPU lub procesora GPU w chmurze zarządzane przez obszar roboczy. Idealne rozwiązanie do użycia w przypadku obciążeń produkcyjnych w miarę automatycznego skalowania do Twoich potrzeb.
  • Klastry Kubernetes: umożliwia tworzenie lub dołączanie klastra usługi Azure Kubernetes Service (AKS). Idealne rozwiązanie do wdrażania wytrenowanych modeli uczenia maszynowego w scenariuszach produkcyjnych.
  • Dołączone zasoby obliczeniowe: umożliwia dołączanie innych zasobów obliczeniowych platformy Azure do obszaru roboczego, takich jak pule usługi Azure Databricks lub Synapse Spark.
  • Obliczenia bezserwerowe: w pełni zarządzane zasoby obliczeniowe na żądanie, których można używać do zadań szkoleniowych.

Uwaga

Gdy usługa Azure Machine Learning tworzy zasoby obliczeniowe bezserwerowe i zarządza nimi, nie znajduje się ona na stronie obliczeniowej w studio. Dowiedz się więcej o sposobie używania bezserwerowych obliczeń na potrzeby trenowania modelu

Chociaż obliczenia są najważniejszym zasobem podczas pracy z obciążeniami uczenia maszynowego, może to być również najbardziej kosztowne. W związku z tym najlepszym rozwiązaniem jest umożliwienie administratorom tworzenia zasobów obliczeniowych i zarządzania nimi. Analitycy danych nie powinni mieć możliwości edytowania zasobów obliczeniowych, ale używają tylko dostępnych zasobów obliczeniowych do uruchamiania obciążeń.

Tworzenie magazynów danych i zarządzanie nimi

Obszar roboczy nie przechowuje żadnych danych. Zamiast tego wszystkie dane są przechowywane w magazynach danych, które są odwołaniami do usług danych platformy Azure. Informacje o połączeniu z usługą danych reprezentowaną przez magazyn danych są przechowywane w usłudze Azure Key Vault.

Po utworzeniu obszaru roboczego zostanie utworzone i automatycznie połączone z obszarem roboczym konto usługi Azure Storage. W związku z tym masz już cztery magazyny danych dodane do obszaru roboczego:

  • workspaceartifactstore: łączy się z kontenerem azureml konta usługi Azure Storage utworzonego za pomocą obszaru roboczego. Służy do przechowywania dzienników obliczeniowych i eksperymentów podczas uruchamiania zadań.
  • workspaceworkingdirectory: łączy się z udziałem plików konta usługi Azure Storage utworzonego z obszarem roboczym używanym przez sekcję Notesy programu Studio. Za każdym razem, gdy przekazujesz pliki lub foldery w celu uzyskania dostępu z wystąpienia obliczeniowego, pliki lub foldery są przekazywane do tego udziału plików.
  • workspaceblobstore: łączy się z usługą Blob Storage konta usługi Azure Storage utworzonego za pomocą obszaru roboczego. W szczególności azureml-blobstore-... kontener. Ustaw jako domyślny magazyn danych, co oznacza, że za każdym razem, gdy tworzysz zasób danych i przekazujesz dane, dane są przechowywane w tym kontenerze.
  • workspacefilestore: łączy się z udziałem plików konta usługi Azure Storage utworzonego za pomocą obszaru roboczego. W szczególności azureml-filestore-... udział plików.

Ponadto można tworzyć magazyny danych w celu nawiązania połączenia z innymi usługami danych platformy Azure. Najczęściej magazyny danych łączą się z kontem usługi Azure Storage lub usługą Azure Data Lake Storage (Gen2), ponieważ te usługi danych są najczęściej używane w projektach nauki o danych.