예: Azure Machine Learning을 사용하여 사용자 지정 기술 빌드 및 배포(보관됨)

아티클
02/01/2023

이 예제는 보관되고 지원되지 않습니다. Azure Machine Learning을 사용하여 사용자 지정 기술을 만들어 리뷰에서 측면 기반 감정을 추출하는 방법을 설명했습니다. 이를 통해 동일한 검토 내에서 긍정적이고 부정적인 감정을 직원, 회의실, 로비 또는 풀과 같은 식별된 엔터티에 올바르게 할당할 수 있었습니다.

Azure Machine Learning에서 측면 기반 감정 모델을 학습하려면 nlp 레시피 리포지토리사용합니다. 그러면 모델이 Azure Kubernetes 클러스터에 엔드포인트로 배포됩니다. 배포되면 엔드포인트가 Cognitive Search 서비스에서 사용하기 위한 AML 기술로 보강 파이프라인에 추가됩니다.

두 개의 데이터 세트가 제공됩니다. 모델을 직접 학습하려면 hotel_reviews_1000.csv 파일이 필요합니다. 학습 단계를 건너뛰고 싶은가요? hotel_reviews_100.csv다운로드합니다.

Azure Cognitive Search 인스턴스 만들기
Azure Machine Learning 작업 영역 만들기(검색 서비스 및 작업 영역이 동일한 구독에 있어야 합니다.)
Azure Kubernetes 클러스터에 모델 학습 및 배포
AI 보강 파이프라인을 배포된 모델에 연결
배포된 모델의 출력을 사용자 지정 기술로 처리

중요하다

이 기술은 추가 사용 약관에 따라 공개 미리 보기로 제공됩니다. 미리 보기 REST API 이 기술을 지원합니다.

필수 구성 요소

Azure 구독 - 무료 구독을받으세요.
Cognitive Search 서비스
Cognitive Services 리소스
Azure Storage 계정)
Azure Machine Learning 작업 영역

설치

샘플 리포지토리 콘텐츠를 복제하거나 다운로드합니다.
다운로드가 zip 파일인 경우 콘텐츠를 추출합니다. 파일을 읽기/쓰기로 설정했는지 확인하세요.
Azure 계정 및 서비스를 설정하는 동안 이름 및 키를 쉽게 액세스할 수 있는 텍스트 파일에 복사합니다. 이름 및 키는 Azure 서비스에 액세스하기 위한 변수가 정의된 Notebook의 첫 번째 셀에 추가됩니다.
Azure Machine Learning 및 해당 요구 사항에 익숙하지 않은 경우 시작하기 전에 다음 문서를 검토해야 합니다.
Azure Machine Learning 대한 개발 환경 구성
Azure 포털에서 Azure Machine Learning 작업 영역을 만들고 관리하기
Azure Machine Learning에 대한 개발 환경을 구성할 때 클라우드 기반 컴퓨팅 인스턴스 사용하여 빠르고 쉽게 시작할 수 있습니다.
스토리지 계정의 컨테이너에 데이터 세트 파일을 업로드합니다. Notebook에서 학습 단계를 수행하려는 경우 더 큰 파일이 필요합니다. 학습 단계를 건너뛰려면 더 작은 파일을 사용하는 것이 좋습니다.

Notebook을 열고 Azure 서비스에 연결

첫 번째 셀 내의 Azure 서비스에 대한 액세스를 허용하는 변수에 필요한 모든 정보를 입력하고 셀을 실행합니다.
두 번째 셀을 실행하면 구독에 대한 검색 서비스에 연결되었는지 확인합니다.
섹션 1.1 - 1.5에서는 검색 서비스 데이터 저장소, 기술 세트, 인덱스 및 인덱서가 생성됩니다.

이 시점에서 Azure Machine Learning에서 학습 데이터 집합 및 실험을 만드는 단계를 건너뛰고 GitHub 리포지토리의 모델 폴더에 제공된 두 모델을 등록하기 위해 직접 건너뛸 수 있습니다. 이러한 단계를 건너뛰면 Notebook에서 3.5 섹션인 '점수 매기기 스크립트 작성'으로 바로 이동하게 됩니다. 이렇게 하면 시간이 절약됩니다. 데이터 다운로드 및 업로드 단계를 완료하는 데 최대 30분이 걸릴 수 있습니다.

모델 만들기 및 학습

섹션 2에는 nlp 레시피 리포지토리에서 글로브 임베딩 파일을 다운로드하는 6개의 셀이 있습니다. 다운로드한 후 파일이 Azure Machine Learning 데이터 저장소에 업로드됩니다. .zip 파일은 약 2G이며 이러한 작업을 수행하는 데 다소 시간이 소요됩니다. 업로드되면 학습 데이터가 추출되고 이제 섹션 3으로 이동할 준비가 되었습니다.

측면 기반 감정 모델 학습 및 엔드포인트 배포

Notebook의 섹션 3은 섹션 2에서 만든 모델을 학습시키고, 해당 모델을 등록하고, Azure Kubernetes 클러스터에서 엔드포인트로 배포합니다. Azure Kubernetes에 익숙하지 않은 경우 유추 클러스터를 만들기 전에 다음 문서를 검토하는 것이 좋습니다.

Azure Kubernetes 서비스 개요
AKS(Azure Kubernetes Service) 대한 Kubernetes 핵심 개념
AKS(Azure Kubernetes Service) 할당량, 가상 머신 크기 제한 및 지역 가용성

유추 클러스터를 만들고 배포하는 데 최대 30분이 걸릴 수 있습니다. 최종 단계로 넘어가기 전에 웹 서비스를 테스트하고, 기술 세트를 업데이트하고, 인덱서 실행을 권장합니다.

역량을 업데이트

Notebook의 섹션 4에는 기술 세트 및 인덱서가 업데이트되는 4개의 셀이 있습니다. 또는 포털을 사용하여 기술 세트에 새 기술을 선택하고 적용한 다음 인덱서로 실행하여 검색 서비스를 업데이트할 수 있습니다.

포털에서 Skillset으로 이동하여 JSON(Skillset Definition) 링크를 선택합니다. 포털은 노트북의 첫 번째 셀에서 생성된 기술 집합의 JSON을 표시합니다. 디스플레이 오른쪽에는 기술 정의 템플릿을 선택할 수 있는 드롭다운 메뉴가 있습니다. AML(Azure Machine Learning) 템플릿을 선택합니다. 에서는 Azure ML 작업 영역의 이름과 유추 클러스터에 배포된 모델의 엔드포인트를 제공합니다. 템플릿은 엔드포인트 URI 및 키로 업데이트됩니다.

창에서 기술 세트 템플릿을 복사하여 왼쪽의 기술 세트 정의에 붙여넣습니다. 템플릿을 편집하여 누락된 값을 제공합니다.

이름
묘사
문맥
'inputs' 이름 및 원본
'출력' 이름 및 '대상 이름'

스킬셋을 저장하세요.

기술 세트를 저장한 후 인덱서로 이동하여 JSON(인덱서 정의) 링크를 선택합니다. 포털은 Notebook의 첫 번째 셀에서 만든 인덱서의 JSON을 표시합니다. 인덱서가 올바르게 처리하고 전달할 수 있도록 출력 필드 매핑을 추가 필드 매핑으로 업데이트해야 합니다. 변경 내용을 저장한 다음 실행을 선택합니다.

리소스 정리

자체 구독에서 작업하는 경우 프로젝트를 마치면 만든 리소스가 여전히 필요한지 여부를 확인하는 것이 좋습니다. 리소스를 실행 상태로 남겨두면 비용이 발생할 수 있습니다. 리소스를 개별적으로 삭제하거나 리소스 그룹을 삭제하여 전체 리소스 집합을 삭제할 수 있습니다.

왼쪽 탐색 창에서 모든 리소스 또는 리소스 그룹 링크를 사용하여 포털에서 리소스를 찾고 관리할 수 있습니다.

무료 서비스를 사용하는 경우 세 개의 인덱스, 인덱서 및 데이터 원본으로 제한됩니다. 포털에서 개별 항목을 삭제하여 제한에 따라 유지할 수 있습니다.

다음을 통해 공유