Co to jest obszar roboczy usługi Azure Machine Learning?
Obszary robocze to miejsca do współpracy z innymi osobami w celu tworzenia artefaktów uczenia maszynowego i pracy związanej z grupą. Na przykład eksperymenty, zadania, zestawy danych, modele, składniki i punkty końcowe wnioskowania. W tym artykule opisano obszary robocze, sposób zarządzania dostępem do nich oraz sposób ich używania do organizowania pracy.
Chcesz rozpocząć? Utwórz obszar roboczy.
Zadania wykonywane w obszarze roboczym
W przypadku zespołów uczenia maszynowego obszar roboczy to miejsce do organizowania swojej pracy. Poniżej przedstawiono niektóre zadania, które można rozpocząć od obszaru roboczego:
- Tworzenie zadań — zadania to przebiegi szkoleniowe używane do tworzenia modeli. Zadania można grupować w eksperymenty , aby porównać metryki.
- Tworzenie potoków — potoki są przepływami pracy wielokrotnego użytku na potrzeby trenowania i ponownego trenowania modelu.
- Rejestrowanie zasobów danych — zasoby danych ułatwiają zarządzanie danymi używanymi do trenowania modelu i tworzenia potoku.
- Rejestrowanie modeli — po utworzeniu modelu, który chcesz wdrożyć, należy utworzyć zarejestrowany model.
- Tworzenie punktów końcowych online — użyj zarejestrowanego modelu i skryptu oceniania, aby utworzyć punkt końcowy online.
- Wdrażanie modelu — użyj zarejestrowanego modelu i skryptu oceniania, aby wdrożyć model.
Oprócz grupowania wyników uczenia maszynowego obszary robocze hostuje również konfiguracje zasobów:
- Docelowe obiekty obliczeniowe służą do uruchamiania eksperymentów.
- Magazyny danych definiują sposób, w jaki ty i inni mogą łączyć się ze źródłami danych podczas korzystania z zasobów danych.
- Ustawienia zabezpieczeń — ustawienia sieci, tożsamości i dostępu oraz szyfrowania.
Organizowanie obszarów roboczych
W przypadku potencjalnych klientów i administratorów zespołu uczenia maszynowego obszary robocze służą jako kontenery do zarządzania dostępem, zarządzania kosztami i izolacji danych. Oto kilka wskazówek dotyczących organizowania obszarów roboczych:
- Użyj ról użytkowników do zarządzania uprawnieniami w obszarze roboczym między użytkownikami. Na przykład analityk danych, inżynier uczenia maszynowego lub administrator.
- Przypisywanie dostępu do grup użytkowników: przy użyciu grup użytkowników firmy Microsoft Entra nie trzeba dodawać poszczególnych użytkowników do każdego obszaru roboczego, a do innych zasobów ta sama grupa użytkowników wymaga dostępu.
- Tworzenie obszaru roboczego na projekt: chociaż obszar roboczy może być używany dla wielu projektów, ograniczenie go do jednego projektu na obszar roboczy umożliwia raportowanie kosztów naliczane na poziomie projektu. Umożliwia również zarządzanie konfiguracjami, takimi jak magazyny danych w zakresie każdego projektu.
- Udostępnianie zasobów platformy Azure: obszary robocze wymagają utworzenia kilku skojarzonych zasobów. Udostępnij te zasoby między obszarami roboczymi, aby zapisać powtarzające się kroki konfiguracji.
- Włącz samoobsługę: twórz i zabezpieczaj skojarzone zasoby jako administrator IT i używaj ról użytkowników, aby umożliwić analitykom danych tworzenie własnych obszarów roboczych.
- Udostępnianie zasobów: zasoby można udostępniać między obszarami roboczymi przy użyciu rejestrów usługi Azure Machine Learning.
W jaki sposób moja zawartość jest przechowywana w obszarze roboczym?
Obszar roboczy przechowuje historię wszystkich przebiegów trenowania z dziennikami, metrykami, danymi wyjściowymi, metadanymi pochodzenia i migawką skryptów. Podczas wykonywania zadań w usłudze Azure Machine Learning artefakty są generowane. Ich metadane i dane są przechowywane w obszarze roboczym i w skojarzonych z nimi zasobach.
Skojarzone zasoby
Podczas tworzenia nowego obszaru roboczego musisz przenieść inne zasoby platformy Azure do przechowywania danych. Jeśli te zasoby nie zostaną ci udostępnione, zostaną automatycznie utworzone przez usługę Azure Machine Learning.
Konto usługi Azure Storage. Przechowuje artefakty uczenia maszynowego, takie jak dzienniki zadań. Domyślnie to konto magazynu jest używane podczas przekazywania danych do obszaru roboczego. Notesy Jupyter używane z wystąpieniami obliczeniowymi usługi Azure Machine Learning są również przechowywane w tym miejscu.
Ważne
Nie można użyć istniejącego konta usługi Azure Storage, jeśli jest to:
- Konto typu BlobStorage
- Konto Premium (Premium_LRS i Premium_GRS)
- Konto z hierarchiczną przestrzenią nazw (używane z usługą Azure Data Lake Storage Gen2).
Magazyn w warstwie Premium lub hierarchiczna przestrzeń nazw można użyć jako dodatkowego magazynu, tworząc magazyn danych.
Nie należy włączać hierarchicznej przestrzeni nazw na koncie magazynu po uaktualnieniu do warstwy ogólnego przeznaczenia w wersji 2.
Jeśli korzystasz z istniejącego konta magazynu ogólnego przeznaczenia w wersji 1, po utworzeniu obszaru roboczego możesz uaktualnić go do warstwy Ogólnego przeznaczenia w wersji 2 .
Azure Container Registry (ACR). Przechowuje utworzone kontenery platformy Docker podczas tworzenia środowisk niestandardowych za pośrednictwem usługi Azure Machine Learning. Wdrożenie modeli automatycznego uczenia maszynowego i profilu danych spowoduje również wyzwolenie tworzenia środowisk niestandardowych.
Obszary robocze można tworzyć bez usługi ACR jako zależności, jeśli nie trzeba tworzyć niestandardowych kontenerów platformy Docker. Usługa Azure Machine Learning może odczytywać dane z zewnętrznych rejestrów kontenerów.
Usługa ACR zostanie automatycznie aprowizowana podczas tworzenia niestandardowych obrazów platformy Docker. Użyj kontroli dostępu opartej na rolach (RBAC) platformy Azure, aby uniemożliwić kompilowanie kontenerów platformy Docker klienta.
Ważne
Jeśli ustawienie subskrypcji wymaga dodania tagów do zasobów, usługa ACR utworzona przez usługę Azure Machine Learning zakończy się niepowodzeniem, ponieważ nie możemy ustawić tagów na wartość ACR.
aplikacja systemu Azure Insights. Ułatwia monitorowanie i zbieranie informacji diagnostycznych z punktów końcowych wnioskowania.
Aby uzyskać więcej informacji, zobacz Monitorowanie punktów końcowych online.
Azure Key Vault. Przechowuje wpisy tajne, które są używane przez obiekty docelowe obliczeń i inne poufne informacje potrzebne w obszarze roboczym.
Tworzenie obszaru roboczego
Istnieje wiele sposobów tworzenia obszaru roboczego. Aby rozpocząć pracę, użyj jednej z następujących opcji:
- Usługa Azure Machine Learning Studio umożliwia szybkie tworzenie obszaru roboczego z ustawieniami domyślnymi.
- Użyj witryny Azure Portal dla interfejsu typu punkt-kliknięcie z większymi opcjami zabezpieczeń.
- Jeśli pracujesz w programie Visual Studio Code, użyj rozszerzenia PROGRAMU VS Code.
Aby zautomatyzować tworzenie obszaru roboczego przy użyciu preferowanych ustawień zabezpieczeń:
- Szablony usługi Azure Resource Manager/Bicep zapewniają składnię deklaratywną do wdrażania zasobów platformy Azure. Alternatywną opcją jest użycie narzędzia Terraform. Zobacz również szablon Bicep lub szablon narzędzia Terraform.
- Użyj interfejsu wiersza polecenia usługi Azure Machine Learning lub zestawu SDK usługi Azure Machine Learning dla języka Python do tworzenia prototypów i w ramach przepływów pracy metodyki MLOps.
- Użyj interfejsu wiersza polecenia usługi Azure Machine Learning lub zestawu SDK usługi Azure Machine Learning dla języka Python do tworzenia prototypów i w ramach przepływów pracy metodyki MLOps.
- Użyj interfejsów API REST bezpośrednio w środowisku skryptów na potrzeby integracji platformy lub przepływów pracy metodyki MLOps.
Narzędzia do interakcji i zarządzania obszarem roboczym
Po skonfigurowaniu obszaru roboczego możesz wchodzić z nim w interakcje w następujący sposób:
- W dowolnym środowisku języka Python z zestawem Azure Machine Learning SDK.
- W wierszu polecenia przy użyciu rozszerzenia interfejsu wiersza polecenia usługi Azure Machine Learning w wersji 2
- W dowolnym środowisku języka Python z zestawem Azure Machine Learning SDK
- W wierszu polecenia przy użyciu rozszerzenia interfejsu wiersza polecenia usługi Azure Machine Learning w wersji 1
Następujące zadania zarządzania obszarami roboczymi są dostępne w każdym interfejsie.
Zadanie zarządzania obszarem roboczym | Portal | Studio | Zestaw SDK dla języka Python | Interfejs wiersza polecenia platformy Azure | VS Code |
---|---|---|---|---|---|
Tworzenie obszaru roboczego | ✓ | ✓ | ✓ | ✓ | ✓ |
Zarządzanie dostępem do obszaru roboczego | ✓ | ✓ | |||
Tworzenie zasobów obliczeniowych i zarządzanie nimi | ✓ | ✓ | ✓ | ✓ | ✓ |
Tworzenie wystąpienia obliczeniowego | ✓ | ✓ | ✓ | ✓ |
Ostrzeżenie
Przeniesienie obszaru roboczego usługi Azure Machine Learning do innej subskrypcji lub przeniesienie subskrypcji będącej właścicielem do nowej dzierżawy nie jest obsługiwane. Może to spowodować błędy.
Zasoby podrzędne
Podczas tworzenia klastrów obliczeniowych i wystąpień obliczeniowych w usłudze Azure Machine Learning tworzone są zasoby podrzędne.
- Maszyny wirtualne: zapewniają moc obliczeniową dla wystąpień obliczeniowych i klastrów obliczeniowych, których używasz do uruchamiania zadań.
- Moduł równoważenia obciążenia: moduł równoważenia obciążenia sieciowego jest tworzony dla każdego wystąpienia obliczeniowego i klastra obliczeniowego w celu zarządzania ruchem nawet podczas zatrzymania wystąpienia obliczeniowego/klastra.
- Sieć wirtualna: ułatwiają one zasobom platformy Azure komunikowanie się ze sobą, Internetem i innymi sieciami lokalnymi.
- Przepustowość: hermetyzuje wszystkie wychodzące transfery danych w różnych regionach.
Następne kroki
Aby dowiedzieć się więcej na temat planowania obszaru roboczego dla wymagań organizacji, zobacz Organizowanie i konfigurowanie usługi Azure Machine Learning.
Aby rozpocząć pracę z usługą Azure Machine Learning, zobacz: