Eksplorowanie i używanie wyselekcjonowanych środowisk

Ukończone

Kuratorowane środowiska to wstępnie utworzone środowiska dla najbardziej typowych obciążeń uczenia maszynowego, które są domyślnie dostępne w środowisku roboczym.

Środowiska wyselekcjonowane używają prefiksu AzureML- i są przeznaczone do obsługi skryptów korzystających z popularnych struktur i narzędzi uczenia maszynowego.

Na przykład istnieją wyselekcjonowane środowiska, dla których chcesz uruchomić skrypt, który szkoli regresję, klasterowanie lub model klasyfikacji za pomocą biblioteki Scikit-Learn.

Aby eksplorować środowisko wyselekcjonowane, możesz wyświetlić je w studio, przy użyciu interfejsu wiersza polecenia platformy Azure lub zestawu SDK języka Python.

Następujące polecenie umożliwia pobranie opisu i tagów środowiska nadzorowanego przy użyciu zestawu SDK języka Python:

env = ml_client.environments.get("AzureML-sklearn-0.24-ubuntu18.04-py37-cpu", version=44)
print(env. description, env.tags)

Używaj kuratorowanego środowiska

Najczęściej używasz środowisk, gdy chcesz uruchomić skrypt jako (polecenie) zadanie.

Aby określić środowisko, którego chcesz użyć do uruchomienia skryptu, należy odwołać się do środowiska pod jego nazwą i wersją.

Na przykład poniższy kod pokazuje, jak skonfigurować zadanie polecenia za pomocą zestawu SDK języka Python, które używa nadzorowanego środowiska, w tym biblioteki Scikit-Learn:

from azure.ai.ml import command

# configure job
job = command(
    code="./src",
    command="python train.py",
    environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
    compute="aml-cluster",
    display_name="train-with-curated-environment",
    experiment_name="train-with-curated-environment"
)

# submit job
returned_job = ml_client.create_or_update(job)

Testuj i rozwiąż problemy w przygotowanym środowisku

Ponieważ wyselekcjonowane środowiska umożliwiają szybsze wdrażanie, najlepszym rozwiązaniem jest najpierw sprawdzenie, czy można użyć jednego ze wstępnie utworzonych środowisk wyselekcjonowanych do uruchomienia kodu.

Możesz sprawdzić, czy środowisko wyselekcjonowane zawiera wszystkie niezbędne pakiety, przeglądając jego szczegóły. Następnie możesz przetestować, używając środowiska do uruchomienia skryptu.

Jeśli środowisko nie zawiera wszystkich pakietów niezbędnych do uruchomienia kodu, zadanie zakończy się niepowodzeniem.

Gdy zadanie zakończy się niepowodzeniem, możesz przejrzeć szczegółowe dzienniki błędów w Dane wyjściowe i dzienniki karcie zadania w usłudze Azure Machine Learning Studio.

Typowy komunikat o błędzie wskazujący, że środowisko jest niekompletne, jest ModuleNotFoundError. Moduł, który nie został znaleziony, znajduje się w komunikacie o błędzie. Przeglądając komunikat o błędzie, możesz zaktualizować środowisko, aby uwzględnić biblioteki, aby upewnić się, że niezbędne pakiety są zainstalowane na docelowym obiekcie obliczeniowym przed uruchomieniem kodu.

Jeśli musisz określić inne niezbędne pakiety, możesz użyć wyselekcjonowanych środowisk jako punkt odniesienia dla swoich własnych środowisk niestandardowych, modyfikując pliki Dockerfile, na których opierają się te wyselekcjonowane środowiska.