Azure Machine Learning 작업 영역이란?
작업 영역은 동료와 협력하여 기계 학습 아티팩트 및 그룹 관련 작업을 만들 수 있는 장소입니다. 예를 들어, 실험, 작업, 데이터 세트, 모델, 구성 요소, 유추 엔드포인트 등이 있습니다. 이 문서에서는 작업 영역, 작업 영역에 대한 액세스를 관리하는 방법, 작업 영역을 사용하여 작업을 구성하는 방법에 대해 설명합니다.
시작할 준비가 되셨나요? 작업 영역을 만듭니다.
작업 영역 내에서 수행되는 작업
기계 학습 팀의 경우 작업 영역은 작업을 정리하는 장소입니다. 작업 영역에서 시작할 수 있는 몇 가지 작업은 다음과 같습니다.
- 작업 만들기 - 작업은 모델을 빌드하는 데 사용하는 학습 실행입니다. 작업을 실험으로 그룹화하여 메트릭을 비교할 수 있습니다.
- 작성 파이프라인 - 파이프라인은 모델 학습 및 재학습을 위해 재사용 가능한 워크플로입니다.
- 데이터 자산 등록 - 데이터 자산은 모델 학습 및 파이프라인 만들기에 사용하는 데이터 관리에 도움이 됩니다.
- 모델 등록 - 배포하려는 모델이 있으면 등록된 모델을 만듭니다.
- 온라인 엔드포인트 만들기 - 등록된 모델과 채점 스크립트를 사용하여 온라인 엔드포인트를 만듭니다.
- 모델 배포 - 등록된 모델과 채점 스크립트를 사용하여 모델을 배포합니다.
기계 학습 결과를 그룹화하는 것 외에도 작업 영역은 리소스 구성도 호스팅합니다.
- 컴퓨팅 대상은 실험을 실행하는 데 사용합니다.
- 데이터 저장소는 데이터 자산을 사용할 때 사용자와 다른 사람들이 데이터 원본에 연결할 수 있는 방법을 정의합니다.
- 보안 설정 - 네트워킹, ID 및 액세스 제어, 암호화 설정입니다.
작업 영역 구성
기계 학습 팀장과 관리자에게 작업 영역은 액세스 관리, 비용 관리 및 데이터 격리를 위한 컨테이너 역할을 합니다. 작업 영역 구성에 대한 몇 가지 팁은 다음과 같습니다.
- 사용자 간의 작업 영역에서 권한을 관리하려면 사용자 역할을 사용합니다. 예를 들어, 데이터 과학자, 기계 학습 엔지니어 또는 관리자가 있습니다.
- 사용자 그룹에 액세스 권한 할당: Microsoft Entra 사용자 그룹을 사용하면 각 작업 영역 및 동일한 사용자 그룹이 액세스해야 하는 다른 리소스에 개별 사용자를 추가할 필요가 없습니다.
- 프로젝트당 작업 영역 만들기: 작업 영역을 여러 프로젝트에 사용할 수 있지만 작업 영역당 하나의 프로젝트로 제한하면 프로젝트 수준에서 발생한 비용을 보고할 수 있습니다. 또한 각 프로젝트 범위 내에서 데이터 저장소와 같은 구성을 관리할 수 있습니다.
- Azure 리소스 공유: 작업 영역을 사용하려면 여러 개의 관련 리소스를 만들어야 합니다. 반복적인 설정 단계를 저장하려면 작업 영역 간에 이러한 리소스를 공유합니다.
- 셀프 서비스 사용: IT 관리자로서 관련 리소스를 미리 만들기 및 보호하고, 사용자 역할을 사용하여 데이터 과학자가 스스로 작업 영역을 만들 수 있도록 합니다.
- 자산 공유: Azure Machine Learning 레지스트리를 사용하여 작업 영역 간에 자산을 공유할 수 있습니다.
내 콘텐츠는 작업 영역에 어떻게 저장되나요?
작업 영역에는 로그, 메트릭, 출력, 계보 메타데이터 및 스크립트 스냅샷을 포함한 모든 학습 실행 기록이 보관됩니다. Azure Machine Learning에서 작업을 수행하면 아티팩트가 생성됩니다. 해당 메타데이터와 데이터는 작업 영역 및 관련 리소스에 저장됩니다.
연결된 리소스
새 작업 영역을 만들 때 데이터를 저장할 다른 Azure 리소스를 가져와야 합니다. 사용자가 제공하지 않은 경우 이러한 리소스는 Azure Machine Learning에 의해 자동으로 만들어집니다.
Azure Storage 계정입니다. 작업 로그와 같은 기계 학습 아티팩트를 저장합니다. 기본적으로 이 스토리지 계정은 작업 영역에 데이터를 업로드할 때 사용됩니다. Azure Machine Learning 컴퓨팅 인스턴스에 사용하는 Jupyter Notebook도 여기에 저장됩니다.
Important
다음과 같은 경우에는 기존 Azure Storage 계정을 사용할 수 없습니다.
- BlobStorage 형식의 계정
- Premium 계정(Premium_LRS 및 Premium_GRS)
- 계층 구조 네임스페이스가 있는 계정(Azure Data Lake Storage Gen2와 함께 사용됨)
데이터 저장소를 만들어 프리미엄 스토리지 또는 계층 구조 네임스페이스를 추가 스토리지로 사용할 수 있습니다.
범용 v2로 업그레이드한 다음에는 스토리지 계정에서 계층 구조 네임스페이스를 사용하도록 설정하지 마세요.
기존 범용 v1 스토리지 계정을 가져오는 경우 작업 영역이 만들어진 후 이 계정을 범용 v2로 업그레이드할 수 있습니다.
ACR(Azure Container Registry). Azure Machine Learning을 통해 사용자 지정 환경을 빌드할 때 만들어진 Docker 컨테이너를 저장합니다. 또한 AutoML 모델 및 데이터 프로필을 배포하면 사용자 지정 환경 만들기가 트리거됩니다.
사용자 지정 Docker 컨테이너를 빌드할 필요가 없는 경우 종속성인 ACR 없이 작업 영역을 만들 수 있습니다. Azure Machine Learning은 외부 컨테이너 레지스트리에서 읽을 수 있습니다.
사용자 지정 Docker 이미지를 빌드하면 ACR이 자동으로 프로비전됩니다. 고객 Docker 컨테이너가 빌드되지 않도록 하려면 Azure RBAC(Azure 역할 기반 액세스 제어)를 사용합니다.
Important
구독 설정에서 해당 하위 리소스에 태그를 추가해야 하는 경우 ACR에 태그를 설정할 수 없으므로 Azure Machine Learning에서 만든 ACR이 실패합니다.
Azure Application Insights. 유추 엔드포인트에서 진단 정보를 모니터링하고 수집하는 데 도움이 됩니다.
자세한 내용은 온라인 엔드포인트 모니터링을 참조하세요.
Azure Key Vault 컴퓨팅 대상에서 사용되는 비밀과 작업 영역에 필요한 기타 중요한 정보를 저장합니다.
작업 영역 만들기
작업 영역은 다양한 방법으로 만들 수 있습니다. 시작하려면 다음 옵션 중 하나를 사용합니다.
- Azure Machine Learning 스튜디오를 사용하면 기본 설정으로 작업 영역을 빠르게 만들 수 있습니다.
- 더 많은 보안 옵션을 갖춘 포인트 앤 클릭 인터페이스를 위해 Azure Portal을 사용합니다.
- Visual Studio Code에서 작업하는 경우 VS Code 확장을 사용합니다.
원하는 보안 설정을 사용하여 작업 영역 만들기를 자동화하려면 다음을 수행합니다.
- Azure Resource Manager/Bicep 템플릿은 Azure 리소스를 배포하기 위한 선언적 구문을 제공합니다. 다른 옵션은 Terraform을 사용하는 것입니다. 또한 Bicep 템플릿 또는 Terraform 템플릿을 참조하세요.
- 프로토타입 제작 및 MLOps 워크플로의 일부로 Azure Machine Learning CLI 또는 Python용 Azure Machine Learning SDK를 사용합니다.
- 프로토타입 제작 및 MLOps 워크플로의 일부로 Azure Machine Learning CLI 또는 Python용 Azure Machine Learning SDK를 사용합니다.
- 플랫폼 통합 또는 MLOps 워크플로를 위해 스크립팅 환경에서 직접 REST API를 사용합니다.
작업 영역 상호 작용 및 관리를 위한 도구
작업 영역이 설정되면 다음과 같은 방법으로 상호 작용할 수 있습니다.
- Azure Machine Learning SDK를 사용하는 모든 Python 환경에서.
- Azure Machine Learning CLI 확장 v2를 사용하는 명령줄에서
- Azure Machine Learning SDK를 사용하는 모든 Python 환경에서.
- Azure Machine Learning CLI 확장 v1을 사용하는 명령줄에서
각 인터페이스에서는 다음과 같은 작업 영역 관리 작업을 사용할 수 있습니다.
작업 영역 관리 작업 | 포털 | 스튜디오 | Python SDK | Azure CLI | VS 코드 |
---|---|---|---|---|---|
작업 영역 만들기 | |||||
작업 영역 액세스 관리 | |||||
컴퓨팅 리소스 만들기 및 관리 | |||||
컴퓨팅 인스턴스 만들기 |
Warning
Azure Machine Learning 작업 영역을 다른 구독으로 이동하거나 소유하는 구독을 새 테넌트로 이동하는 것은 지원되지 않습니다. 이렇게 하면 오류가 발생할 수 있습니다.
하위 리소스
Azure Machine Learning에서 컴퓨팅 클러스터 및 컴퓨팅 인스턴스를 만들면 하위 리소스가 만들어집니다.
- VM: 작업을 실행하는 데 사용하는 컴퓨팅 인스턴스 및 컴퓨팅 클러스터에 컴퓨팅 성능을 제공합니다.
- Load Balancer: 컴퓨팅 인스턴스/클러스터가 중지된 동안에도 트래픽을 관리하기 위해 각 컴퓨팅 인스턴스 및 컴퓨팅 클러스터에 대해 네트워크 부하 분산 장치가 만들어집니다.
- Virtual Network: Azure 리소스가 서로 간에, 인터넷 및 기타 온-프레미스 네트워크와 통신하도록 지원합니다.
- 대역폭: 지역 간 모든 아웃바운드 데이터 전송을 캡슐화합니다.
다음 단계
조직의 요구 사항에 맞게 작업 영역을 계획하는 방법에 대한 자세한 내용은 Azure Machine Learning 구성 및 설정을 참조하세요.
Azure Machine Learning을 시작하려면 다음을 참조하세요.