다음을 통해 공유


환경 문제 해결

이 문서에서는 환경 이미지 빌드에서 발생할 수 있는 일반적인 문제를 해결하는 방법과 AzureML 환경 취약성에 대해 알아봅니다.

여러분의 적극적인 의견 개진을 기대합니다! 환경 정의 또는 빌드 실패 분석 로그를 통해 이 페이지로 이동하신 경우 기능이 도움이 되었는지 또는 아직 분석에서 다루지 않는 오류 시나리오가 있는지 알고 싶습니다. 이 문서에 피드백을 남길 수도 있습니다. 여기에 의견을 남겨주세요.

Azure Machine Learning 환경

Azure Machine Learning 환경은 기계 학습이 이루어지는 환경을 캡슐화한 것입니다. 학습 및 채점 스크립트와 관련된 기본 docker 이미지, Python 패키지 및 소프트웨어 설정을 지정합니다. 환경은 Machine Learning 작업 영역 내에서 관리되고 버전이 지정되는 자산으로, 다양한 컴퓨팅 대상에 걸쳐 재현, 감사, 이식이 가능한 기계 학습 워크플로를 사용할 수 있습니다.

환경 유형

환경은 큐레이팅, 사용자 관리형, 시스템 관리형의 세 가지 범주로 분류됩니다.

큐레이팅된 환경은 Azure Machine Learning에서 관리하고 기본적으로 모든 작업 영역에서 사용할 수 있는 미리 만들어진 환경입니다. 큐레이팅된 환경은 다양한 기계 학습 프레임워크를 시작하는 데 도움이 되는 Python 패키지 및 설정 컬렉션을 포함하고 있으며, 있는 그대로 사용하면 됩니다. 이와 같이 미리 만들어진 환경에서는 배포 시간을 단축할 수 있습니다.

사용자 관리 환경에서는 사용자가 사용자 환경을 설정하고 컴퓨팅 대상에 학습 스크립트에 필요한 모든 패키지를 설치해야 합니다. 또한 모델 배포에 필요한 종속성을 포함해야 합니다.

이러한 유형의 환경은 두 가지 하위 유형을 갖고 있습니다. 첫 번째 유형인 BYOC(Bring Your Own Container)의 경우 기존 Docker 이미지를 Azure Machine Learning으로 가져옵니다. 두 번째 유형인 Docker 빌드 컨텍스트 기반 환경의 경우 사용자가 제공하는 컨텍스트의 이미지를 Azure Machine Learning이 구체화합니다.

conda를 통해 Python 환경을 자동으로 관리하려면 시스템 관리형 환경을 사용합니다. Azure Machine Learning은 기본 Docker 이미지 위에 conda 사양을 구체화하여 격리된 conda 환경을 새로 만듭니다. 기본적으로 Azure Machine Learning은 파생 이미지에 공통 기능을 추가합니다. 기본 이미지에 있는 Python 패키지는 격리된 conda 환경에서 사용할 수 없습니다.

환경 만들기 및 관리

Azure Machine Learning Python SDK, Azure Machine Learning CLI, Azure Machine Learning Studio UI, Visual Studio Code 확장과 같은 클라이언트에서 환경을 만들고 관리할 수 있습니다.

"익명" 환경은 이미 있는 환경을 등록하거나 참조하지 않고 실험을 제출할 때 작업 영역에 자동으로 등록됩니다. 환경이 나열되지는 않지만 버전 또는 레이블로 환경을 검색할 수 있습니다.

Azure Machine Learning은 환경 정의를 Docker 이미지로 빌드합니다. 또한 Azure Machine Learning 작업 영역과 연결된 Azure Container Registry에 환경을 캐시하므로 후속 학습 작업 및 서비스 엔드포인트 배포에 다시 사용할 수 있습니다. 정의가 같은 여러 환경이 동일한 캐시된 이미지에 있을 수 있습니다.

학습 스크립트를 원격으로 실행하려면 Docker 이미지를 만들어야 합니다.

AzureML 환경의 취약성

최신 버전의 종속성(기본 이미지, Python 패키지 등)으로 업그레이드하거나 보안 요구 사항을 충족하는 다른 종속성으로 마이그레이션하여 취약성을 해결할 수 있습니다. 취약성을 완화하려면 코드와 인프라의 리팩터링이 필요할 수 있으므로 시간이 오래 걸리고 비용이 많이 듭니다. 오픈 소스 소프트웨어가 널리 보급되었고 복잡한 중첩 종속성이 사용되므로 취약성을 관리하고 추적하는 것이 중요합니다.

취약성의 영향을 줄이는 몇 가지 방법이 있습니다.

  • 각 시나리오에 종속성 세트를 최소한으로 사용하여 종속성 수를 줄입니다.
  • 한 곳에서 문제를 살펴보고 해결할 수 있도록 환경을 구획화합니다.
  • 플래그가 지정된 취약성 및 해당 취약성과 현재 상황 사이의 관련성을 파악합니다.

취약성 검사

Container Registry용 Microsoft Defender를 사용하여 환경 보안을 모니터링하고 유지하면 이미지의 취약성을 검사하는 데 도움이 됩니다.

Microsoft Defender의 트리거를 기반으로 이 프로세스를 자동화하려면 클라우드용 Microsoft Defender 트리거에 대한 응답 자동화를 참조하세요.

취약성과 재현성의 비교

재현성은 소프트웨어 개발의 기초 중 하나입니다. 프로덕션 코드를 개발할 때 반복되는 작업은 동일한 결과를 보장해야 합니다. 취약성을 완화하면 종속성이 변경되어 재현성에 방해가 될 수 있습니다.

Azure Machine Learning의 초점은 재현성을 보장하는 것입니다. 환경은 큐레이팅, 사용자 관리형, 시스템 관리형의 세 가지 범주로 분류됩니다.

큐레이팅 환경

큐레이팅된 환경은 Azure Machine Learning이 관리하며 프로비전된 모든 Azure Machine Learning 작업 영역에서 기본적으로 사용할 수 있는 미리 만들어진 환경입니다. 취약성을 해결하기 위해 Azure Machine Learning에서 새 버전이 릴리스되었습니다. 최신 이미지를 사용할지 여부는 재현성과 취약성 관리 사이의 절충안일 수 있습니다.

큐레이팅된 환경에는 다양한 기계 학습 프레임워크를 시작하는 데 도움이 되는 Python 패키지 및 설정 컬렉션이 포함되어 있습니다. 있는 그대로 사용하면 됩니다. 이와 같이 미리 만들어진 환경에서는 배포 시간을 단축할 수 있습니다.

사용자 관리 환경

사용자 관리형 환경에서는 사용자가 직접 환경을 설정하고, 학습 스크립트에 필요한 모든 패키지를 컴퓨팅 대상에 설치하고, 모델을 배포해야 합니다. 이러한 유형의 환경은 두 가지 하위 유형을 갖고 있습니다.

  • BYOC(Bring Your Own Container): 사용자가 Azure Machine Learning에 Docker 이미지를 제공합니다.
  • Docker 빌드 컨텍스트: 사용자가 제공하는 콘텐츠의 이미지를 Azure Machine Learning이 구체화합니다.

Microsoft 제공 이미지 위에 더 많은 종속성을 설치하거나 고유한 기본 이미지를 가져오면 취약성 관리는 사용자의 책임이 됩니다.

시스템 관리 환경

Conda를 통해 Python 환경을 자동으로 관리하려는 경우 시스템 관리 환경을 사용합니다. Azure Machine Learning은 기본 Docker 이미지 위에 conda 사양을 구체화하여 격리된 conda 환경을 새로 만듭니다. Azure Machine Learning이 릴리스마다 기본 이미지를 패치하지만, 최신 이미지의 사용 여부를 결정하려면 재현성과 취약성 관리 사이에서 절충점을 찾아야 할 수 있습니다. 따라서 시스템 관리형 환경을 사용할 때 작업 또는 모델 배포에 사용할 환경 버전을 선택하는 것은 사용자의 책임입니다.

취약성: 일반적인 문제

기본 Docker 이미지의 취약성

환경의 시스템 취약성은 일반적으로 기본 이미지에서 시작됩니다. 예를 들어, "Ubuntu" 또는 "Debian"으로 표시된 취약성은 환경의 시스템 수준(기본 Docker 이미지)에서 발생합니다. 기본 이미지가 타사 발급자의 것인 경우 최신 버전에 플래그가 지정된 취약성에 대한 수정 사항이 있는지 확인하세요. Azure Machine Learning의 기본 이미지에 대한 가장 일반적인 원본은 다음과 같습니다.

  • MAR(Microsoft Artifact Registry), 또는 Microsoft Container Registry(mcr.microsoft.com)라고 합니다.
    • MAR 홈페이지에서 카탈로그 API 또는 /tags/list를 호출하여 이미지를 나열할 수 있습니다.
    • AzureML의 학습 기본 이미지에 대한 원본 및 릴리스 정보는 Azure/AzureML-Containers에서 찾을 수 있습니다.
  • Nvidia(nvcr.io 또는 Nvidia 프로필)

최신 버전의 기본 이미지로 취약성이 해결되지 않는 경우 취약성 검사에서 권장하는 버전을 설치하여 기본 이미지 취약성을 해결할 수 있습니다.

apt-get install -y library_name

Python 패키지의 취약성

취약성은 시스템 관리 기본 이미지 외에 설치된 Python 패키지에서도 발생할 수 있습니다. 이러한 Python 관련 취약성은 Python 종속성을 업데이트하여 해결해야 합니다. 이미지의 Python(pip) 취약성은 일반적으로 사용자 정의 종속성에서 발생합니다.

알려진 Python 취약성과 솔루션을 검색하려면 GitHub 자문 데이터베이스를 참조하세요. Python 취약성을 해결하려면 플래그가 지정된 문제에 대한 수정 사항이 포함된 버전으로 패키지를 업데이트합니다.

pip install -u my_package=={good.version}

Conda 환경을 사용하는 경우 conda 종속성 파일에서 참조를 업데이트합니다.

어떤 경우에는 Conda가 기본 Docker 이미지 위에 환경을 설정하는 동안 Python 패키지가 자동으로 설치됩니다. 이에 대한 완화 단계는 사용자가 도입한 패키지의 완화 단계와 동일합니다. Conda는 실현되는 모든 환경에 필요한 종속성을 설치합니다. 암호화, setuptools, 휠 등과 같은 패키지는 conda의 기본 채널에서 자동으로 설치됩니다. 최신 패키지 버전이 누락된 기본 anaconda 채널에 알려진 문제가 있으므로 커뮤니티에서 관리하는 conda-forge 채널의 우선 순위를 지정하는 것이 좋습니다. 그렇지 않으면 해당 환경에서 실행하려는 코드에서 참조하지 않더라도 패키지와 버전을 명시적으로 지정하세요.

캐시 문제

Azure Machine Learning 작업 영역과 연결되는 것은 컨테이너 이미지의 캐시인 Azure Container Registry 인스턴스입니다. 구체화된 모든 이미지는 컨테이너 레지스트리에 푸시되며 해당 환경에 대한 실험 또는 배포를 트리거할 때 사용됩니다. Azure Machine Learning은 컨테이너 레지스트리의 이미지를 삭제하지 않으며, 시간이 지나면서 어떤 이미지를 유지할 것인지 평가하는 것은 사용자의 책임입니다.

환경 이미지 빌드 문제 해결

환경 이미지 빌드 및 패키지 설치와 관련된 문제를 해결하는 방법을 알아봅니다.

환경 정의 문제

환경 이름 문제

큐레이팅된 접두사는 허용되지 않음

큐레이팅된 환경에만 예약된 용어를 사용자 지정 환경의 이름으로 사용할 때 이 문제가 발생할 수 있습니다. 큐레이팅된 환경은 Microsoft에서 유지 관리하는 환경입니다. 사용자 지정 환경은 사용자가 만들고 유지 관리하는 환경입니다.

가능한 원인:

  • 환경 이름은 Microsoft 또는 AzureML로 시작합니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

현재 사용 중인 예약된 접두사를 제외하도록 환경 이름을 업데이트합니다.

리소스

너무 긴 환경 이름

가능한 원인:

  • 환경 이름이 255자를 초과합니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

환경 이름을 255자 이하로 업데이트합니다.

Docker 문제

적용 대상: Azure CLI ml 확장 v1

적용 대상: Python SDK azureml v1

새 환경을 만들려면 다음 방법 중 하나를 사용해야 합니다(DockerSection 참조).

  • 기본 이미지
    • 기본 이미지 이름, 기본 이미지를 끌어올 리포지토리 및 자격 증명(필요한 경우)을 제공합니다.
    • conda 사양 제공
  • 기본 Dockerfile
    • Dockerfile 제공
    • conda 사양 제공
  • Docker 빌드 컨텍스트
    • 빌드 컨텍스트 위치(URL) 제공
    • 빌드 컨텍스트에는 적어도 Dockerfile이 포함되어야 하지만, 다른 파일도 포함될 수 있습니다.

적용 대상: Azure CLI ml 확장 v2(현재)

적용 대상: Python SDK azure-ai-ml v2(현재)

새 환경을 만들려면 다음 방법 중 하나를 사용해야 합니다.

  • Docker 이미지
    • Docker Hub 또는 Azure Container Registry 같은 레지스트리에 호스트되는 이미지의 이미지 URI을 제공합니다.
    • 샘플은 여기
  • Docker 빌드 컨텍스트
    • 빌드 컨텍스트 역할을 하는 디렉터리 지정
    • 이 디렉터리에는 Dockerfile 및 이미지를 빌드하는 데 필요한 다른 파일이 포함되어야 함
    • 샘플은 여기
  • Conda 사양
    • 환경의 기본 Docker 이미지를 지정해야 합니다. Azure Machine Learning은 제공된 Docker 이미지 위에 conda 환경을 빌드합니다.
    • conda 파일의 상대 경로를 제공합니다.
    • 샘플은 여기

Docker 정의 없음

적용 대상: Python SDK azureml v1

이 문제는 환경 정의에 DockerSection이 없을 때 발생할 수 있습니다. 이 섹션에서는 환경 사양으로 빌드한 최종 Docker 이미지와 관련된 설정을 구성합니다.

가능한 원인:

  • 환경 정의의 DockerSection을 지정하지 않았습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

환경 정의에 DockerSection을 추가하여 기본 이미지, 기본 dockerfile 또는 docker 빌드 컨텍스트를 지정합니다.

from azureml.core import Environment
myenv = Environment(name="myenv")
# Specify docker steps as a string.
dockerfile = r'''
FROM mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04
RUN echo "Hello from custom container!"
'''

myenv.docker.base_dockerfile = dockerfile

리소스

Docker 옵션이 너무 많음

가능한 원인:

적용 대상: Python SDK azureml v1

환경 정의에 이러한 Docker 옵션이 여러 개 지정되어 있습니다.

  • base_image
  • base_dockerfile
  • build_context
  • DockerSection을 참조하세요.

적용 대상: Azure CLI ml 확장 v2(현재)

적용 대상: Python SDK azure-ai-ml v2(현재)

환경 정의에 이러한 Docker 옵션이 여러 개 지정되어 있습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

환경을 빌드하는 데 사용할 Docker 옵션을 선택합니다. 그런 다음, 지정된 나머지 옵션을 [없음]으로 설정합니다.

적용 대상: Python SDK azureml v1

from azureml.core import Environment
myenv = Environment(name="myEnv")
dockerfile = r'''
FROM mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04
RUN echo "Hello from custom container!"
'''
myenv.docker.base_dockerfile = dockerfile
myenv.docker.base_image = "pytorch/pytorch:latest"

# Having both base dockerfile and base image set will cause failure. Delete the one you won't use.
myenv.docker.base_image = None

Docker 옵션 없음

가능한 원인:

환경 정의에서 다음 옵션 중 하나를 지정하지 않았습니다.

  • base_image
  • base_dockerfile
  • build_context
  • DockerSection을 참조하세요.

적용 대상: Azure CLI ml 확장 v2(현재)

적용 대상: Python SDK azure-ai-ml v2(현재)

환경 정의에서 다음 옵션 중 하나를 지정하지 않았습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

환경을 빌드하는 데 사용할 Docker 옵션을 선택한 다음, 환경 정의에서 해당 옵션을 채웁니다.

적용 대상: Python SDK azureml v1

from azureml.core import Environment
myenv = Environment(name="myEnv")
myenv.docker.base_image = "pytorch/pytorch:latest"

적용 대상: Python SDK azure-ai-ml v2(현재)

env_docker_image = Environment(
    image="pytorch/pytorch:latest",
    name="docker-image-example",
    description="Environment created from a Docker image.",
)
ml_client.environments.create_or_update(env_docker_image)

리소스

컨테이너 레지스트리 자격 증명의 사용자 이름 또는 암호 없음

가능한 원인:

  • 환경 정의에서 컨테이너 레지스트리의 사용자 이름 또는 암호 중 하나만 지정하고 다른 하나는 지정하지는 않았습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

누락된 사용자 이름 또는 암호를 환경 정의에 추가하여 문제를 해결합니다.

myEnv.docker.base_image_registry.username = "username"

또는 작업 영역 연결을 통해 인증을 제공합니다.

from azureml.core import Workspace
ws = Workspace.from_config()
ws.set_connection("connection1", "ACR", "<URL>", "Basic", "{'Username': '<username>', 'Password': '<password>'}")

적용 대상: Azure CLI ml 확장 v2(현재)

YAML 사양 파일에서 작업 영역 연결 만들기

az ml connection create --file connection.yml --resource-group my-resource-group --workspace-name my-workspace

참고 항목

  • 환경 정의에서 자격 증명을 제공하는 것은 더 이상 지원되지 않습니다. 작업 영역 연결을 대신 사용하세요.

리소스

기본 이미지 레지스트리에 대한 자격 증명이 여러 개 있음

가능한 원인:

  • 기본 이미지 레지스트리의 자격 증명 세트를 여러 개 지정했습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

작업 영역 연결을 사용하는 경우 설정한 연결을 확인하고 사용하지 않으려는 연결을 삭제합니다.

from azureml.core import Workspace
ws = Workspace.from_config()
ws.list_connections()
ws.delete_connection("myConnection2")

환경 정의에서 자격 증명을 지정한 경우 사용할 자격 증명 세트를 하나 선택하고 나머지는 전부 null로 설정합니다.

myEnv.docker.base_image_registry.registry_identity = None

참고 항목

  • 환경 정의에서 자격 증명을 제공하는 것은 더 이상 지원되지 않습니다. 작업 영역 연결을 대신 사용하세요.

리소스

기본 이미지 레지스트리의 비밀

가능한 원인:

  • 환경 정의에서 자격 증명을 지정했습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

환경 정의에서 자격 증명을 지정하는 것은 더 이상 지원되지 않습니다. 환경 정의에서 자격 증명을 삭제하고 작업 영역 연결을 대신 사용하세요.

적용 대상: Python SDK azureml v1

작업 영역에서 작업 영역 연결을 설정합니다.

from azureml.core import Workspace
ws = Workspace.from_config()
ws.set_connection("connection1", "ACR", "<URL>", "Basic", "{'Username': '<username>', 'Password': '<password>'}")

적용 대상: Azure CLI ml 확장 v2(현재)

YAML 사양 파일에서 작업 영역 연결 만들기

az ml connection create --file connection.yml --resource-group my-resource-group --workspace-name my-workspace

리소스

사용되지 않는 Docker 특성

가능한 원인:

  • 환경 정의에서 이제는 사용되지 않는 Docker 특성을 지정했습니다.
  • 다음은 사용되지 않는 속성입니다.
    • enabled
    • arguments
    • shared_volumes
    • gpu_support
      • 이제 Azure Machine Learning은 NVIDIA Docker 확장이 출시되면 자동으로 검색하여 사용합니다.
    • smh_size

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

환경 정의의 DockerSection에서 이러한 특성을 지정하는 대신 DockerConfiguration을 사용합니다.

리소스

Dockerfile 길이 제한 초과

가능한 원인:

  • 지정한 Dockerfile이 최대 크기 제한인 100KB를 초과했습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

Dockerfile 크기를 이 제한 아래로 줄입니다.

리소스

Docker 빌드 컨텍스트 문제

Docker 빌드 컨텍스트 위치 없음

가능한 원인:

  • 환경 정의에서 빌드 컨텍스트 디렉터리의 경로를 제공하지 않았습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

DockerSectionbuild_context에 경로를 포함합니다.

적용 대상: Azure CLI ml 확장 v2(현재)

적용 대상: Python SDK azure-ai-ml v2(현재)

빌드 컨텍스트의 경로를 포함합니다.

리소스

Dockerfile 경로 없음

이 문제는 Azure Machine Learning이 Dockerfile을 찾지 못할 때 발생할 수 있습니다. 기본적으로 Azure Machine Learning은 사용자가 Dockerfile 경로를 지정하지 않는 한 빌드 컨텍스트 디렉터리의 루트에서 'Dockerfile'이라는 Dockerfile을 찾습니다.

가능한 원인:

  • Dockerfile이 빌드 컨텍스트 디렉터리의 루트에 없고/없거나 파일 이름이 'Dockerfile'이 아닌 다른 이름으로 지정되었으며 파일 경로를 제공하지 않았습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

DockerSectionbuild_contextdockerfile_path를 포함합니다.

적용 대상: Azure CLI ml 확장 v2(현재)

적용 대상: Python SDK azure-ai-ml v2(현재)

Dockerfile 경로를 지정합니다.

리소스

Docker 빌드 컨텍스트를 사용하여 특성을 지정할 수 없음

이 문제는 환경 정의에서 Docker 빌드 컨텍스트에 포함할 수 없는 속성을 지정한 경우에 발생할 수 있습니다.

가능한 원인:

  • 환경 정의에서 다음 속성 중 하나 이상과 함께 Docker 빌드 컨텍스트를 지정했습니다.
    • 환경 변수
    • Conda 종속성
    • R
    • Spark

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

환경 정의에서 위에 나열된 속성을 지정했다면 해당 속성을 제거합니다.

  • Docker 빌드 컨텍스트를 사용 중이고 conda 종속성을 지정하고 싶으면 conda 사양이 빌드 컨텍스트 디렉터리에 있어야 합니다.

리소스

지원되지 않는/알 수 없는 위치 유형

가능한 원인:

  • Docker 빌드 컨텍스트의 위치 유형을 지원되지 않거나 알 수 없는 것으로 지정했습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

허용되는 위치 유형은 다음과 같습니다.

  • Git
    • Azure Machine Learning에 git URL을 제공할 수는 있지만 아직은 이미지를 빌드하는 데 사용할 수 없습니다. 빌드에서 Git를 지원할 때까지 스토리지 계정을 사용하세요.
  • 스토리지 계정

리소스

잘못된 위치

가능한 원인:

  • 지정된 Docker 빌드 컨텍스트 위치가 잘못되었습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

Docker 빌드 컨텍스트를 스토리지 계정에 저장하는 경우

  • 빌드 컨텍스트의 경로를 다음과 같이 지정해야 합니다.

    https://<storage-account>.blob.core.windows.net/<container>/<path>

  • 제공한 위치가 유효한 URL이어야 합니다.

  • 컨테이너 및 경로를 지정했는지 확인합니다.

리소스

기본 이미지 문제

기본 이미지는 사용되지 않음

가능한 원인:

  • 이제는 사용되지 않는 기본 이미지를 사용했습니다.
    • Azure Machine Learning은 사용되지 않는 이미지를 사용하여 실패한 빌드의 문제 해결을 지원하지 않습니다.
    • Azure Machine Learning은 이러한 이미지를 업데이트하거나 유지 관리하지 않으므로 취약성 위험이 있습니다.

다음 기본 이미지는 사용되지 않습니다.

  • azureml/base
  • azureml/base-gpu
  • azureml/base-lite
  • azureml/intelmpi2018.3-cuda10.0-cudnn7-ubuntu16.04
  • azureml/intelmpi2018.3-cuda9.0-cudnn7-ubuntu16.04
  • azureml/intelmpi2018.3-ubuntu16.04
  • azureml/o16n-base/python-slim
  • azureml/openmpi3.1.2-cuda10.0-cudnn7-ubuntu16.04
  • azureml/openmpi3.1.2-ubuntu16.04
  • azureml/openmpi3.1.2-cuda10.0-cudnn7-ubuntu18.04
  • azureml/openmpi3.1.2-cuda10.1-cudnn7-ubuntu18.04
  • azureml/openmpi3.1.2-cuda10.2-cudnn7-ubuntu18.04
  • azureml/openmpi3.1.2-cuda10.2-cudnn8-ubuntu18.04
  • azureml/openmpi3.1.2-ubuntu18.04
  • azureml/openmpi4.1.0-cuda11.0.3-cudnn8-ubuntu18.04
  • azureml/openmpi4.1.0-cuda11.1-cudnn8-ubuntu18.04

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

기본 이미지를 지원되는 최신 버전의 이미지로 업그레이드합니다.

태그 또는 다이제스트 없음

가능한 원인:

  • 지정된 기본 이미지에 버전 태그 또는 다이제스트를 포함하지 않았습니다.
  • 이러한 지정자 중 하나가 없으면 환경을 재현할 수 없습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

기본 이미지에 다음 지정자 중 하나 이상을 포함합니다.

환경 변수 문제

잘못 배치된 런타임 변수

가능한 원인:

  • 환경 정의에서 런타임 변수를 지정했습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

RunConfiguration 개체에서 environment_variables 특성을 대신 사용하세요.

Python 문제

Python 섹션이 없음

가능한 원인:

  • 환경 정의에 Python 섹션이 없습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

환경 정의의 Python 섹션을 채웁니다.

Python 버전 없음

가능한 원인:

  • 환경 정의에서 Python 버전을 지정하지 않았습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

Python을 conda 패키지로 추가하고 버전을 지정합니다.

from azureml.core.environment import CondaDependencies

myenv = Environment(name="myenv")
conda_dep = CondaDependencies()
conda_dep.add_conda_package("python==3.8")
env.python.conda_dependencies = conda_dep

conda 사양에 YAML을 사용하는 경우 Python을 종속성으로 포함합니다.

name: project_environment
dependencies:
  - python=3.8
  - pip:
      - azureml-defaults
channels:
  - anaconda

여러 Python 버전

가능한 원인:

  • 환경 정의에서 Python 버전을 여러 개 지정했습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

사용할 Python 버전을 선택하고 나머지 버전을 모두 제거합니다.

myenv.python.conda_dependencies.remove_conda_package("python=3.8")

conda 사양에 YAML을 사용하는 경우 Python 버전 중 하나만 종속성으로 포함합니다.

지원되지 않는 Python 버전

가능한 원인:

  • 수명이 종료되었거나 수명 종료가 임박했으며 더 이상 지원되지 않는 Python 버전을 지정했습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

수명 종료에 도달하지 않았고 수명 종료가 임박하지도 않은 Python 버전을 지정합니다.

가능한 원인:

  • 수명이 종료되었거나 수명 종료가 임박한 Python 버전을 지정했습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

수명 종료에 도달하지 않았고 수명 종료가 임박하지도 않은 Python 버전을 지정합니다.

Python 버전의 유효성을 검사할 수 없음

가능한 원인:

  • 잘못된 구문 또는 잘못된 서식으로 Python 버전을 지정했습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

SDK를 사용하여 올바른 구문으로 Python 버전을 지정합니다.

myenv.python.conda_dependencies.add_conda_package("python=3.8")

올바른 구문을 사용하여 conda YAML로 Python 버전을 지정합니다.

name: project_environment
dependencies:
  - python=3.8
  - pip:
      - azureml-defaults
channels:
  - anaconda

리소스

Conda 문제

conda 종속성 없음

가능한 원인:

  • 환경 정의에서 conda 사양을 제공하지 않았으며 user_managed_dependenciesFalse(기본값)로 설정되었습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

Azure Machine Learning이 conda_dependencies,에 따라 자동으로 Python 환경을 만들지 않게 하려면 user_managed_dependenciesTrue로 설정합니다.

env.python.user_managed_dependencies = True
  • 사용자는 스크립트를 실행하기로 선택하는 Python 환경에 모든 필수 패키지를 제공해야 합니다.

Azure Machine Learning이 conda 사양에 따라 자동으로 Python 환경을 만들게 하려면 환경 정의에서 conda_dependencies를 채워야 합니다.

from azureml.core.environment import CondaDependencies

env = Environment(name="env")
conda_dep = CondaDependencies()
conda_dep.add_conda_package("python==3.8")
env.python.conda_dependencies = conda_dep

적용 대상: Azure CLI ml 확장 v2(현재)

적용 대상: Python SDK azure-ai-ml v2(현재)

환경의 기본 Docker 이미지를 지정해야 합니다. 그러면 Azure Machine Learning이 해당 이미지를 기반으로 conda 환경을 빌드합니다.

리소스

잘못된 conda 종속성

가능한 원인:

  • 환경 정의에 지정된 conda 종속성의 형식을 잘못 지정했습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

적용 대상: Python SDK azureml v1

conda_dependencies는 conda 종속성 YAML 구조의 JSONified 버전이어야 합니다.

"condaDependencies": {
    "channels": [
    "anaconda",
        "conda-forge"
    ],
    "dependencies": [
        "python=3.8",
        {
            "pip": [
                "azureml-defaults"
            ]
        }
    ],
    "name": "project_environment"
}

add_conda_package 메서드를 사용하여 conda 종속성을 지정할 수도 있습니다.

from azureml.core.environment import CondaDependencies

env = Environment(name="env")
conda_dep = CondaDependencies()
conda_dep.add_conda_package("python==3.8")
env.python.conda_dependencies = conda_dep

적용 대상: Azure CLI ml 확장 v2(현재)

적용 대상: Python SDK azure-ai-ml v2(현재)

환경의 기본 Docker 이미지를 지정해야 합니다. 그러면 Azure Machine Learning이 해당 이미지를 기반으로 conda 환경을 빌드합니다.

conda 채널 없음

가능한 원인:

  • 환경 정의에서 conda 채널을 지정하지 않았습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

환경을 재현하려면 종속성을 끌어올 채널을 지정합니다. conda 채널을 지정하지 않으면 conda는 기본값을 사용하며, 기본값은 바뀔 수 있습니다.

적용 대상: Python SDK azureml v1

Python SDK를 사용하여 conda 채널을 추가합니다.

from azureml.core.environment import CondaDependencies

env = Environment(name="env")
conda_dep = CondaDependencies()
conda_dep.add_channel("conda-forge")
env.python.conda_dependencies = conda_dep

conda 사양에 YAML을 사용하는 경우 원하는 conda 채널을 포함합니다.

name: project_environment
dependencies:
  - python=3.8
  - pip:
      - azureml-defaults
channels:
  - anaconda
  - conda-forge

리소스

가능한 원인:

  • 환경 정의에서 기본 conda 환경을 지정했습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

환경을 일부만 업데이트하면 종속성 충돌 및/또는 예기치 않은 런타임 오류가 발생할 수 있으므로, 기본 conda 환경을 사용하지 않는 것이 좋습니다.

적용 대상: Python SDK azureml v1

기본 conda 환경을 제거하고, 환경 정의의 conda_dependencies 섹션에서 환경에 필요한 모든 패키지를 지정합니다.

from azureml.core.environment import CondaDependencies

env = Environment(name="env")
env.python.base_conda_environment = None
conda_dep = CondaDependencies()
conda_dep.add_conda_package("python==3.8")
env.python.conda_dependencies = conda_dep

적용 대상: Azure CLI ml 확장 v2(현재)

적용 대상: Python SDK azure-ai-ml v2(현재)

표준 conda YAML 구성 파일을 사용하여 환경을 정의합니다.

리소스

고정되지 않은 종속성

가능한 원인:

  • conda 사양에서 특정 패키지의 버전을 지정하지 않았습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

종속성 버전을 지정하지 않으면 conda 패키지 확인자가 동일한 환경의 후속 빌드에서 다른 버전의 패키지를 선택할 가능성이 있습니다. 이렇게 되면 환경의 재현성이 손상되고 예기치 않은 오류가 발생할 수 있습니다.

적용 대상: Python SDK azureml v1

conda 사양에 패키지를 추가할 때 버전 번호를 포함합니다.

from azureml.core.environment import CondaDependencies

conda_dep = CondaDependencies()
conda_dep.add_conda_package("numpy==1.24.1")

conda 사양에 YAML을 사용하는 경우 종속성의 버전을 지정합니다.

name: project_environment
dependencies:
  - python=3.8
  - pip:
      - numpy=1.24.1
channels:
  - anaconda
  - conda-forge

리소스

Pip 문제

Pip가 지정되지 않음

가능한 원인:

  • conda 사양에서 pip를 종속성으로 지정하지 않았습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

재현 가능하도록 conda 사양에서 pip를 종속성으로 지정하고 고정해야 합니다.

적용 대상: Python SDK azureml v1

pip를 해당 버전과 함께 종속성으로 지정합니다.

env.python.conda_dependencies.add_conda_package("pip==22.3.1")

conda 사양에 YAML을 사용하는 경우 pip를 종속성으로 포함합니다.

name: project_environment
dependencies:
  - python=3.8
  - pip=22.3.1
  - pip:
      - numpy=1.24.1
channels:
  - anaconda
  - conda-forge

리소스

Pip가 고정되지 않음

가능한 원인:

  • conda 사양에서 pip 버전을 지정하지 않았습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

pip 버전을 지정하지 않으면 동일한 환경의 후속 빌드에서 다른 버전이 사용될 수 있습니다. 이렇게 되면 다른 버전의 pip가 패키지를 다르게 확인할 경우 재현성 문제 및 기타 예기치 않은 오류가 발생할 수 있습니다.

적용 대상: Python SDK azureml v1

conda 종속성에서 pip 버전을 지정합니다.

env.python.conda_dependencies.add_conda_package("pip==22.3.1")

conda 사양에 YAML을 사용하는 경우 pip 버전을 지정합니다.

name: project_environment
dependencies:
  - python=3.8
  - pip=22.3.1
  - pip:
      - numpy=1.24.1
channels:
  - anaconda
  - conda-forge

리소스

기타 환경 문제

R 섹션은 사용되지 않음

가능한 원인:

  • 환경 정의에서 R 섹션을 지정했습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

R용 Azure Machine Learning SDK는 2021년 말부터 더 이상 사용되지 않으며 Azure CLI v2를 사용하여 개선된 R 학습 및 배포 환경을 제공할 것입니다.

적용 대상: Python SDK azureml v1

환경 정의에서 R 섹션을 제거합니다.

env.r = None

Azure CLI v2를 사용하여 R 모델 학습을 시작하려면 샘플 리포지토리를 참조하세요.

환경에 대한 정의가 없습니다.

가능한 원인:

  • 존재하지 않거나 등록되지 않은 환경을 지정했습니다.
  • 환경 이름 또는 환경 버전을 지정할 때 철자가 잘못되었거나 구문 오류가 발생했습니다.

영향을 받는 영역(증상):

  • 환경 등록 실패

문제 해결 단계

올바른 버전과 함께 환경 이름을 올바르게 지정합니다.

  • path-to-resource:version-number

다른 방식으로 환경의 '최신' 버전을 지정해야 합니다.

  • path-to-resource@latest

이미지 빌드 문제

ACR 문제

ACR 연결 불가

이 문제는 작업 영역의 연결된 ACR(Azure Container Registry) 리소스에 액세스하지 못하는 경우에 발생할 수 있습니다.

가능한 원인:

  • 작업 영역의 ACR이 VNet(가상 네트워크)(프라이빗 엔드포인트 또는 서비스 엔드포인트) 뒤에 있으며, 이미지를 빌드하는 데 컴퓨팅 클러스터를 사용하고 있지 않습니다.
  • 작업 영역의 ACR이 VNet(가상 네트워크)(프라이빗 엔드포인트 또는 서비스 엔드포인트) 뒤에 있으며 이미지를 빌드하는 데 사용되는 컴퓨팅 클러스터가 작업 영역의 ACR에 액세스할 수 없습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.
  • 파이프라인 작업이 실패합니다.
  • 모델 배포가 실패합니다.

문제 해결 단계

  • 컴퓨팅 클러스터의 VNet이 작업 영역의 ACR에 액세스할 수 있는지 확인합니다.
  • 컴퓨팅 클러스터가 CPU 기반인지 확인합니다.

참고 항목

  • Azure Machine Learning 컴퓨팅 클러스터만 지원됩니다. 컴퓨팅, AKS(Azure Kubernetes Service) 또는 기타 인스턴스 유형은 이미지 빌드 컴퓨팅에 지원되지 않습니다.

리소스

예상치 않은 Dockerfile 형식입니다.

이 문제는 Dockerfile 형식이 잘못되었을 때 발생할 수 있습니다.

가능한 원인:

  • Dockerfile에 잘못된 구문이 포함되어 있습니다.
  • Dockerfile에 UTF-8과 호환되지 않는 문자가 포함되어 있습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • Dockerfile의 형식을 올바르게 지정하고 UTF-8로 인코딩합니다.

리소스

Docker 끌어오기 문제

Docker 이미지를 끌어올 수 없음

이 문제는 이미지 빌드 중에 Docker 이미지 끌어오기가 실패할 때 발생할 수 있습니다.

가능한 원인:

  • 컨테이너 레지스트리의 경로 이름이 잘못되었습니다.
  • 가상 네트워크 뒤에 있는 컨테이너 레지스트리가 지원되지 않는 지역에서 프라이빗 엔드포인트를 사용하고 있습니다.
  • 참조하려는 이미지가 지정한 컨테이너 레지스트리에 없습니다.
  • 이미지를 끌어오려는 프라이빗 레지스트리에 대한 자격 증명을 제공하지 않았거나, 제공된 자격 증명이 잘못되었습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

컨테이너 레지스트리의 경로 이름이 올바른지 확인합니다.

  • 3.2 태그가 있는 my-registry.io 레지스트리와 test/image 이미지의 유효한 이미지 경로는 my-registry.io/test/image:3.2입니다.
  • 레지스트리 경로 설명서를 참조하세요.

컨테이너 레지스트리가 가상 네트워크 뒤에 있거나 지원되지 않는 지역에서 프라이빗 엔드포인트를 사용 중인 경우

  • 포털의 서비스 엔드포인트(공용 액세스)를 사용하여 컨테이너 레지스트리를 구성하고 다시 시도합니다.
  • 컨테이너 레지스트리를 가상 네트워크 뒤에 배치한 후에는 작업 영역이 컨테이너 레지스트리 인스턴스와 통신할 수 있도록 Azure Resource Manager 템플릿을 실행합니다.

참조하려는 이미지가 지정한 컨테이너 레지스트리에 없는 경우

  • 올바른 태그를 사용했으며 user_managed_dependenciesTrue로 설정했는지 확인합니다. user_managed_dependenciesTrue로 설정하여 conda를 사용하지 않도록 설정하고 사용자가 설치한 패키지를 사용합니다.

이미지를 끌어오려는 프라이빗 레지스트리의 자격 증명을 제공하지 않았거나 제공한 자격 증명이 잘못되었습니다.

리소스

I/O 오류

이 문제는 네트워크 문제로 인해 Docker 이미지 끌어오기가 실패할 때 발생할 수 있습니다.

가능한 원인:

  • 네트워크 연결 문제. 일시적인 문제일 수 있습니다.
  • 방화벽이 연결을 차단합니다.
  • ACR에 연결할 수 없으며 네트워크가 격리되어 있습니다. 자세한 내용은 ACR 연결 불가를 참조하세요.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

방화벽 규칙에 호스트를 추가합니다.

작업 영역 설정을 평가합니다. 가상 네트워크를 사용하고 있나요, 또는 가상 네트워크 뒤에 있는 이미지를 빌드하는 동안 액세스하려는 리소스가 있나요?

  • 가상 네트워크를 사용하여 작업 영역 보호 문서의 단계를 따릅니다.
  • Azure Machine Learning을 사용하려면 공용 인터넷에 대한 인바운드 및 아웃바운드 액세스가 모두 필요합니다. 가상 네트워크 설정에 문제가 있는 경우 이미지 빌드 중에 필요한 특정 리포지토리에 액세스하는 데 문제가 있을 수 있습니다.

가상 네트워크를 사용하지 않거나 올바르게 구성한 경우

  • 이미지를 다시 빌드합니다. 네트워크 문제로 인해 시간이 초과된 경우 일시적인 문제일 수 있으며 다시 빌드하면 문제가 해결될 수 있습니다.

빌드 중 Conda 문제

잘못된 사양

이 문제는 conda 사양에 나열된 패키지가 잘못되었거나 conda 명령을 잘못 실행한 경우에 발생할 수 있습니다.

가능한 원인:

  • conda 사양에 사용한 구문이 잘못되었습니다.
  • conda 명령을 잘못 실행하고 있습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

conda create 명령을 잘못 사용하면 conda 사양 오류가 발생할 수 있습니다.

  • 설명서를 읽고 유효한 옵션과 구문을 사용하고 있는지 확인합니다.
  • conda env createconda create를 혼동하는 경우가 많습니다. conda의 응답과 다른 사용자의 알려진 솔루션에 대한 자세한 내용은 여기에서 확인할 수 있습니다.

빌드가 성공하려면 conda yaml에서 적절한 구문과 유효한 패키지 사양을 사용하고 있는지 확인합니다.

통신 오류

이 문제는 conda 사양에 나열된 패키지를 다운로드하려는 엔터티와 통신하는 데 오류가 있을 때 발생할 수 있습니다.

가능한 원인:

  • conda 채널 또는 패키지 리포지토리와 통신하지 못했습니다.
  • 이러한 오류는 일시적인 네트워크 오류 때문에 발생할 수 있습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

conda 사양에서 사용 중인 conda 채널/리포지토리가 올바른지 확인합니다.

  • 해당 항목이 존재하고 철자가 올바른지 확인합니다.

conda 채널/리포지토리가 올바른 경우

  • 이미지를 다시 빌드해 봅니다. 일시적 오류일 수 있으며 다시 빌드하면 문제가 해결될 수도 있습니다.
  • conda 사양에 나열된 패키지가 지정한 채널/리포지토리에 있는지 확인합니다.

컴파일 오류

이 문제는 컴파일러 오류로 인해 conda 환경에 필요한 패키지를 빌드할 수 없을 때 발생할 수 있습니다.

가능한 원인:

  • 패키지의 철자가 잘못되어 인식되지 않았습니다.
  • 컴파일러에 문제가 있습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

컴파일러를 사용하는 경우

  • 사용하는 컴파일러가 인식되는지 확인합니다.
  • 필요한 경우 Dockerfile에 설치 단계를 추가합니다.
  • 컴파일러 버전을 확인하고 사용 중인 모든 명령 또는 옵션이 컴파일러 버전과 호환되는지 확인합니다.
  • 필요하다면 컴파일러 버전을 업그레이드합니다.

나열된 모든 패키지의 철자가 올바르고 버전을 올바르게 고정했는지 확인합니다.

리소스

명령 없음

이 문제는 이미지 빌드 중에 또는 지정된 Python 패키지 요구 사항에서 명령이 인식되지 않을 때 발생할 수 있습니다.

가능한 원인:

  • 명령의 철자가 올바르지 않습니다.
  • 필수 패키지가 설치되지 않아 명령을 실행할 수 없습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • 명령의 철자가 올바른지 확인합니다.
  • 수행하려는 명령을 실행하는 데 필요한 패키지를 설치했는지 확인합니다.
  • 필요한 경우 Dockerfile에 설치 단계를 추가합니다.

리소스

Conda 시간 제한

이 문제는 conda 패키지 확인을 완료하는 데 너무 오래 걸리는 경우에 발생할 수 있습니다.

가능한 원인:

  • conda 사양에 수많은 패키지가 나열되고 불필요한 패키지가 포함되어 있습니다.
  • 종속성을 고정하지 않았습니다(tensorflow=2.8 대신 tensorflow를 포함했음).
  • 솔루션이 없는 패키지를 나열했습니다(X=1.3 및 Y=2.8 패키지를 포함했지만 X 버전이 Y 버전과 호환되지 않음).

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • conda 사양에서 불필요한 패키지를 제거합니다.
  • 패키지를 고정합니다. 환경 확인이 더 빠릅니다.
  • 여전히 문제가 발생하면 이 문서를 검토하여 conda의 성능 이해 및 향상에 대해 자세히 알아봅니다.

메모리 부족

이 문제는 가용 메모리가 소진되어 conda 패키지를 확인할 수 없을 때 발생할 수 있습니다.

가능한 원인:

  • conda 사양에 수많은 패키지가 나열되고 불필요한 패키지가 포함되어 있습니다.
  • 종속성을 고정하지 않았습니다(tensorflow=2.8 대신 tensorflow를 포함했음).
  • 솔루션이 없는 패키지를 나열했습니다(X=1.3 및 Y=2.8 패키지를 포함했지만 X 버전이 Y 버전과 호환되지 않음).

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • conda 사양에서 불필요한 패키지를 제거합니다.
  • 패키지를 고정합니다. 환경 확인이 더 빠릅니다.
  • 여전히 문제가 발생하면 이 문서를 검토하여 conda의 성능 이해 및 향상에 대해 자세히 알아봅니다.

패키지를 찾을 수 없음

이 문제는 사양에 나열된 하나 이상의 conda 패키지를 채널/리포지토리에서 찾을 수 없을 때 발생할 수 있습니다.

가능한 원인:

  • conda 사양에서 패키지의 이름 또는 버전을 잘못 나열했습니다.
  • 패키지가 conda 사양에 나열되지 않은 conda 채널에 있습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • 패키지의 철자가 올바르고 지정된 버전이 있는지 확인합니다.
  • 대상 채널에 패키지가 있는지 확인합니다.
  • 패키지 확인 중에 패키지를 올바르게 끌어올 수 있도록 conda 사양에 채널/리포지토리를 나열했는지 확인합니다.

다음과 같이 conda 사양에서 채널을 지정합니다.

channels:
  - conda-forge
  - anaconda
dependencies:
  - python=3.8
  - tensorflow=2.8
Name: my_environment

리소스

Python 모듈 없음

이 문제는 conda 사양에 나열된 Python 모듈이 없거나 유효하지 않을 때 발생할 수 있습니다.

가능한 원인:

  • 모듈의 철자가 잘못되었습니다.
  • 모듈이 인식되지 않습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • 모듈의 철자가 올바르고 모듈이 있는지 확인합니다.
  • 모듈이 conda 사양에서 지정한 Python 버전과 호환되는지 확인합니다.
  • conda 사양에 특정 Python 버전을 나열하지 않은 경우 모듈과 호환되는 특정 버전을 나열해야 합니다. 그렇지 않으면 호환되지 않는 기본값이 사용될 수 있습니다.

사용 중인 pip 모듈과 호환되는 Python 버전을 고정합니다.

channels:
  - conda-forge
  - anaconda
dependencies:
  - python=3.8
  - pip:
    - dataclasses
Name: my_environment

일치하는 배포판 없음

이 문제는 지정한 버전과 일치하는 패키지를 찾을 수 없을 때 발생할 수 있습니다.

가능한 원인:

  • 패키지 이름을 잘못 입력했습니다.
  • 지정한 채널 또는 피드에서 패키지 및 버전을 찾을 수 없습니다.
  • 지정한 버전이 없습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • 패키지의 철자가 올바르고 패키지가 있는지 확인합니다.
  • 패키지에 대해 지정한 버전이 있는지 확인합니다.
  • 패키지가 설치될 채널을 지정했는지 확인합니다. 채널을 지정하지 않으면 기본 채널이 사용되며, 기본 채널에는 원하는 패키지가 있을 수도 있고 없을 수도 있습니다.

conda yaml 사양에서 채널을 나열하는 방법은 다음과 같습니다.

channels:
  - conda-forge
  - anaconda
dependencies:
  - python = 3.8
  - tensorflow = 2.8
Name: my_environment

리소스

mpi4py를 빌드할 수 없음

이 문제는 mpi4py용 휠을 빌드할 수 없을 때 발생할 수 있습니다.

가능한 원인:

  • mpi4py를 성공적으로 설치하기 위한 요구 사항이 충족되지 않았습니다.
  • 선택한 mpi4py 설치 방법에 문제가 있습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

작동하는 MPI 설치(MPI-3 지원 및 공유/동적 라이브러리로 빌드된 MPI의 기본 설정)가 있는지 확인합니다.

호환되는 Python 버전을 사용하고 있는지 확인합니다.

  • Python 3.8 이상은 수명이 곧 종료될 이전 버전으로 인해 권장됩니다.
  • mpi4py 설치를 참조하세요.

리소스

대화형 인증이 시도됨

이 문제는 패키지 설치 중에 pip가 대화형 인증을 시도할 때 발생할 수 있습니다.

가능한 원인:

  • 인증이 필요한 패키지를 나열했지만 자격 증명을 제공하지 않았습니다.
  • 이미지 빌드 중에 pip가 인증을 요구하려고 시도했으나 빌드 중에 대화형 인증을 제공할 수 없어 빌드가 실패했습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

작업 영역 연결을 통해 인증을 제공합니다.

적용 대상: Python SDK azureml v1

from azureml.core import Workspace
ws = Workspace.from_config()
ws.set_connection("connection1", "PythonFeed", "<URL>", "Basic", "{'Username': '<username>', 'Password': '<password>'}")

적용 대상: Azure CLI ml 확장 v2(현재)

YAML 사양 파일에서 작업 영역 연결 만들기

az ml connection create --file connection.yml --resource-group my-resource-group --workspace-name my-workspace

리소스

사용할 수 없는 Blob

이 문제는 스토리지 계정에서 Blob에 액세스하려는 시도가 거부될 때 발생할 수 있습니다.

가능한 원인:

  • 스토리지 계정에 액세스하는 데 사용하는 권한 부여 방법이 잘못되었습니다.
  • SAS(공유 액세스 서명)를 통해 권한을 부여하려고 시도하지만, SAS 토큰이 만료되었거나 유효하지 않습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

Azure Portal에서 Blob 데이터에 대한 액세스 권한을 부여하는 방법을 읽고 이해하세요.

Azure 스토리지에서 데이터에 대한 액세스 권한을 부여하는 방법을 읽고 이해하세요.

관심이 있으면 SAS를 사용하여 Azure 스토리지 리소스에 액세스를 읽어보세요.

Horovod 빌드

이 문제는 horovod를 빌드하지 못하여 conda 환경을 만들거나 업데이트하지 못할 때 발생할 수 있습니다.

가능한 원인:

  • horovod를 설치하려면 설치되지 않은 다른 모듈이 필요합니다.
  • horovod를 설치하려면 포함되지 않은 특정 라이브러리가 필요합니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

여러 문제로 인해 horovod가 실패할 수 있으며, horovod의 설명서에 포괄적인 문제 목록이 있습니다.

  • horovod 문제 해결 가이드를 검토하세요.
  • 빌드 로그를 검토하여 horovod를 빌드하지 못했을 때 표시된 오류 메시지가 있는지 확인합니다.
  • horovod 문제 해결 가이드에 문제와 솔루션이 설명되어 있을 수 있습니다.

리소스

Conda 명령을 찾을 수 없음

이 문제는 conda 환경을 만들거나 업데이트하는 동안 conda 명령이 인식되지 않을 때 발생할 수 있습니다.

가능한 원인:

  • 사용 중인 기본 이미지에 conda를 설치하지 않았습니다.
  • conda 명령을 실행하기 전에 Dockerfile을 통해 conda를 설치하지 않았습니다.
  • 경로에 conda를 포함하지 않았거나 경로에 conda를 추가하지 않았습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

conda 명령을 실행하기 전에 Dockerfile에 conda가 설치되어 있는지 확인합니다.

conda를 설치하려고 시도했지만 이 문제가 발생하는 경우 경로에 conda를 추가했는지 확인합니다.

리소스

호환되지 않는 Python 버전

이 문제는 사용자가 지정한 Python 버전과 호환되지 않는 conda 환경에 지정된 패키지가 있을 때 발생할 수 있습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

지정한 Python 버전과 호환되는 다른 버전의 패키지를 사용합니다.

또는 지정한 패키지와 호환되는 다른 버전의 Python을 사용합니다.

  • Python 버전을 변경하는 경우 현재 지원되고 수명 종료가 임박하지 않은 버전을 사용합니다.
  • Python 수명 종료 날짜를 참조하세요.

리소스

Conda 기본 리디렉션

이 문제는 명령줄에서 따옴표를 사용하지 않고 "<" 또는 ">"를 사용하여 패키지를 지정한 경우에 발생할 수 있습니다. 이 구문으로 인해 conda 환경 만들기 또는 업데이트가 실패할 수 있습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

패키지 사양을 따옴표로 묶습니다.

  • 예를 들어 conda install -y pip<=20.1.1conda install -y "pip<=20.1.1"로 변경합니다.

UTF-8 디코딩 오류

이 문제는 conda 사양에서 문자를 디코딩하는 데 실패할 때 발생할 수 있습니다. 

가능한 원인:

  • conda YAML 파일에 UTF-8과 호환되지 않는 문자가 포함되어 있습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

빌드 중 Pip 문제

패키지를 설치할 수 없음

이 문제는 Python 패키지를 설치하는 동안 이미지 빌드가 실패할 때 발생할 수 있습니다.

가능한 원인:

  • 이 오류를 일으킬 수 있는 여러 가지 문제가 있습니다.
  • 이 메시지는 일반적인 메시지이며 발생하는 오류를 Azure Machine Learning 분석에서 아직 다루지 않을 때 표시됩니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

빌드 로그를 검토하여 이미지 빌드 실패에 대해 자세히 알아봅니다.

Azure Machine Learning 팀이 오류를 분석할 수 있도록 피드백을 남깁니다.

패키지를 제거할 수 없음

이 문제는 pip가 운영 체제의 패키지 관리자가 설치한 Python 패키지를 제거하지 못할 때 발생할 수 있습니다.

가능한 원인:

  • 기존 pip 문제 또는 문제가 있는 pip 버전
  • 격리된 환경을 사용하지 않아 발생하는 문제

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

다음 문서를 읽고 기존 pip 문제로 인해 오류가 발생했는지 확인합니다.

다음 방법을 시도해 봅니다.

pip install --ignore-installed [package]

conda를 사용하여 별도의 환경을 만들어 봅니다.

잘못된 연산자입니다.

이 문제는 요구 사항에 잘못된 연산자가 발견되어 pip가 Python 패키지를 설치하지 못한 경우 발생할 수 있습니다.

가능한 원인:

  • Python 패키지 요구 사항에 잘못된 연산자가 있습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • 패키지의 철자가 올바르고 지정된 버전이 있는지 확인합니다.
  • 패키지 버전 지정자의 형식이 올바른지, 유효한 비교 연산자를 사용하고 있는지 확인합니다. 버전 지정자를 참조하세요.
  • 잘못된 연산자를 오류 메시지에서 권장하는 연산자로 바꿉니다.

일치하는 배포판 없음

이 문제는 지정한 버전과 일치하는 패키지를 찾을 수 없을 때 발생할 수 있습니다.

가능한 원인:

  • 패키지 이름을 잘못 입력했습니다.
  • 지정한 채널 또는 피드에서 패키지 및 버전을 찾을 수 없습니다.
  • 지정한 버전이 없습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • 패키지의 철자가 올바르고 패키지가 있는지 확인합니다.
  • 패키지에 대해 지정한 버전이 있는지 확인합니다.
  • pip install --upgrade pip를 실행한 후 원래 명령을 다시 실행합니다.
  • 사용 중인 pip가 원하는 Python 버전에 대한 패키지를 설치할 수 있는지 확인합니다. pip 또는 pip3을 사용해야 하나요?를 참조하세요.

리소스

잘못된 휠 파일 이름

이 문제는 휠 파일을 잘못 지정한 경우 발생할 수 있습니다.

가능한 원인:

  • 휠 파일 이름의 철자를 잘못 입력했거나 잘못된 형식을 사용했습니다.
  • 지정한 휠 파일을 찾을 수 없습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • 파일 이름을 올바르게 입력했는지, 파일 이름이 있는지 확인합니다.
  • 휠 파일 이름 형식을 따르고 있는지 확인합니다.

make 문제

지정된 대상이 없고 메이크파일을 찾을 수 없음

이 문제는 대상을 지정하지 않았고 make를 실행할 때 메이크파일을 찾을 수 없는 경우에 발생할 수 있습니다.

가능한 원인:

  • 현재 디렉터리에 메이크파일이 없습니다.
  • 대상이 지정되지 않았습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • 메이크파일의 철자가 올바른지 확인합니다.
  • 메이크파일이 현재 디렉터리에 있는지 확인합니다.
  • 사용자 지정 메이크파일이 있는 경우 make -f custommakefile을 사용하여 해당 메이크파일을 지정합니다.
  • 메이크파일 또는 명령줄에서 대상을 지정합니다.
  • 빌드를 구성하고 메이크파일을 생성합니다.
  • 메이크파일의 서식을 올바르게 지정하고 탭을 사용하여 들여쓰기 했는지 확인합니다.

리소스

복사 문제

파일 없음

이 문제는 Docker가 파일을 찾아 복사하지 못할 때 발생할 수 있습니다.

가능한 원인:

  • Docker 빌드 컨텍스트에서 원본 파일을 찾을 수 없습니다.
  • .dockerignore를 통해 원본 파일이 제외되었습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • 원본 파일이 Docker 빌드 컨텍스트에 있는지 확인합니다.
  • 원본 및 대상 경로가 존재하고 철자가 올바른지 확인합니다.
  • 원본 파일이 현재 디렉터리와 부모 디렉터리의 .dockerignore에 나열되지 않았는지 확인합니다.
  • COPY 명령과 동일한 줄에서 후행 주석을 제거합니다.

리소스

적절한 문제

apt-get 명령을 실행하지 못했습니다.

이 문제는 apt-get 실행에 실패할 때 발생할 수 있습니다.

가능한 원인:

  • 네트워크 연결 문제. 일시적인 문제일 수 있습니다.
  • apt-get을 실행 중인 패키지와 관련된 종속성이 손상되었습니다.
  • apt-get 명령을 사용할 수 있는 올바른 권한이 없습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • 네트워크 연결 및 DNS 설정을 확인합니다.
  • 손상된 종속성을 확인하려면 apt-get check를 실행합니다.
  • apt-get update를 실행한 후 원래 명령을 다시 실행합니다.
  • 손상된 종속성으로 인해 발생하는 문제를 해결하려고 시도하는 -f 플래그와 함께 명령을 실행합니다.
  • sudo apt-get install <package-name>과 같은 sudo 권한으로 명령을 실행합니다.

리소스

Docker 푸시 문제

Docker 이미지를 저장할 수 없음

이 문제는 Docker 이미지를 컨테이너 레지스트리에 푸시하는 데 실패할 때 발생할 수 있습니다.

가능한 원인:

  • 작업 영역과 연결된 ACR에서 일시적인 문제가 발생했습니다.
  • 가상 네트워크 뒤에 있는 컨테이너 레지스트리가 지원되지 않는 지역에서 프라이빗 엔드포인트를 사용하고 있습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드할 수 없습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

작업 영역의 ACR(Azure Container Registry)과 관련된 일시적인 문제라고 판단되면 환경 빌드를 다시 시도합니다.

컨테이너 레지스트리가 가상 네트워크 뒤에 있거나 지원되지 않는 지역에서 프라이빗 엔드포인트를 사용 중인 경우

  • 포털의 서비스 엔드포인트(공용 액세스)를 사용하여 컨테이너 레지스트리를 구성하고 다시 시도합니다.
  • 컨테이너 레지스트리를 가상 네트워크 뒤에 배치한 후에는 작업 영역이 컨테이너 레지스트리 인스턴스와 통신할 수 있도록 Azure Resource Manager 템플릿을 실행합니다.

가상 네트워크를 사용하지 않거나 올바르게 구성한 경우 간단한 로컬 빌드를 시도하여 ACR의 자격 증명이 올바른지 테스트합니다.

알 수 없는 Docker 명령

알 수 없는 Docker 명령

이 문제는 Docker가 Dockerfile의 명령을 인식하지 못할 때 발생할 수 있습니다.

가능한 원인:

  • Dockerfile에서 알 수 없는 Docker 명령이 사용됩니다.
  • Dockerfile에 잘못된 구문이 포함되어 있습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • Docker 명령이 유효하고 철자가 올바른지 확인합니다.
  • Docker 명령과 인수 사이에 공백이 있는지 확인합니다.
  • Dockerfile에 불필요한 공백이 없는지 확인합니다.
  • Dockerfile의 형식을 올바르게 지정하고 UTF-8로 인코딩합니다.

리소스

명령을 찾을 수 없음

명령을 인식할 수 없습니다.

이 문제는 실행 중인 명령이 인식되지 않을 때 발생할 수 있습니다.

가능한 원인:

  • 명령을 실행하기 전에 Dockerfile을 통해 명령을 설치하지 않았습니다.
  • 경로에 명령을 포함하지 않았거나 경로에 추가하지 않았습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계 명령을 실행하기 전에 Dockerfile에 명령 설치 단계가 있는지 확인합니다.

  • 를 검토합니다.

명령 설치를 시도했는데 이 문제가 발생하는 경우 해당 명령을 경로에 추가했는지 확인합니다.

기타 빌드 문제

빌드 로그를 사용할 수 없음

가능한 원인:

  • Azure Machine Learning은 스토리지 계정에 빌드 로그를 저장할 권한이 없습니다.
  • 빌드 로그를 저장하는 동안 일시적인 오류가 발생했습니다.
  • 이미지 빌드가 트리거되기 전에 시스템 오류가 발생했습니다.

영향을 받는 영역(증상):

  • 빌드는 성공했지만 사용 가능한 로그가 없습니다.
  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • Azure Machine Learning이 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

일시적인 오류인 경우 다시 빌드하면 문제가 해결될 수 있습니다.

이미지를 찾을 수 없음

이 문제는 지정한 기본 이미지를 찾을 수 없을 때 발생할 수 있습니다.

가능한 원인:

  • 이미지를 잘못 지정했습니다.
  • 지정한 이미지가 지정한 레지스트리에 없습니다.

영향을 받는 영역(증상):

  • UI, SDK 및 CLI에서 환경을 빌드하지 못했습니다.
  • 첫 번째 단계에서 환경을 암시적으로 빌드하므로 실행 중인 작업이 실패합니다.

문제 해결 단계

  • 기본 이미지의 철자와 형식이 올바른지 확인합니다.
  • 사용 중인 기본 이미지가 지정한 레지스트리에 있는지 확인합니다.

리소스