Machine Learning - 점수
중요
Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.
2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.
- ML Studio(클래식)에서 Azure Machine Learning으로 기계 학습 프로젝트 이동에 대한 정보를 참조하세요.
- Azure Machine Learning에 대한 자세한 정보.
ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.
이 섹션에서는 점수 매기기를 위해 Machine Learning Studio(클래식)에 제공된 모듈을 나열합니다.
점수 매기기는 예측이라고도 하며, 몇 가지 새로운 입력 데이터를 감안할 때 학습된 기계 학습 모델을 기반으로 값을 생성하는 프로세스입니다. 생성된 값 또는 점수는 향후 값의 예측을 나타낼 수 있지만 가능성이 높은 범주 또는 결과를 나타낼 수도 있습니다. 점수의 의미는 제공하는 데이터 형식 및 만든 모델 유형에 따라 달라집니다.
Machine Learning Studio에서 모델 만들기 및 사용(클래식)
기계 학습의 일반적인 워크플로에는 다음 단계가 포함됩니다.
- 적합한 알고리즘을 선택하고 초기 옵션을 설정합니다.
- 호환되는 데이터에 대한 모델 학습
- 모델의 패턴을 기반으로 새 데이터를 사용하여 예측을 만듭니다.
- 모델을 평가하여 예측이 정확한지, 얼마나 많은 오류가 있는지, 과잉 맞춤이 있는지 확인합니다.
Machine Learning Studio(클래식)는 기계 학습을 위한 유연하고 사용자 지정 가능한 프레임워크를 지원합니다. 이 프로세스의 각 작업은 실험의 나머지 부분을 중단하지 않고 수정, 추가 또는 제거할 수 있는 특정 유형의 모듈에 의해 수행됩니다.
이 섹션의 모듈에는 점수 매기기 도구가 포함되어 있습니다. 기계 학습의 이 단계에서는 학습된 모델을 새 데이터에 적용하여 예측을 생성합니다. 이러한 예측을 기계 학습 결과를 사용하는 애플리케이션에 보내거나 점수 매기기 결과를 사용하여 모델의 정확도와 유용성을 평가할 수 있습니다.
점수 매기기 에 대한 자세한 정보
점수 매기기는 기계 학습에서 널리 사용되어 모델 및 일부 새 입력을 고려하여 새 값을 생성하는 프로세스를 의미합니다. 점수 매기기 프로세스는 다양한 형식의 값을 생성할 수 있으므로 "예측"이 아닌 제네릭 용어 "score"가 사용됩니다.
- 권장 항목 목록 및 유사성 점수입니다.
- 시계열 모델 및 회귀 모델의 숫자 값입니다.
- 새 입력이 일부 기존 범주에 속할 가능성을 나타내는 확률 값입니다.
- 새 항목이 가장 유사한 범주 또는 클러스터의 이름입니다.
- 분류 모델에 대해 예측된 클래스 또는 결과입니다.
참고
데이터 분석의 결과로 할당된 가중치 또는 값을 의미하는 데 사용되는 단어 점수 도 들었을 수 있습니다. 그러나 Machine Learning Studio(클래식)에서 채점은 일반적으로 새 데이터에서 예측 값을 생성하는 프로세스를 나타냅니다.
실험에서 이러한 모듈 중 하나를 추가하는 경우 이미 학습된 기계 학습 모델과 몇 가지 새 데이터를 연결해야 합니다. 실험 또는 선택한 모듈을 실행할 때 점수 매기기 모듈은 새 데이터를 수집하고, 모델을 기반으로 점수를 계산하고, 테이블의 점수를 반환합니다.
채점에 사용되는 데이터
입력으로 제공하는 새 데이터에는 일반적으로 모델을 학습하는 데 사용된 열과 레이블 또는 결과 열을 뺀 열이 있어야 합니다.
식별자로만 사용되는 열은 일반적으로 모델을 학습할 때 제외되므로 점수 매기기 시 제외해야 합니다. 그러나 기본 키와 같은 식별자는 나중에 열 추가 모듈을 사용하여 점수 매기기 데이터 세트와 쉽게 다시 결합할 수 있습니다. 이 모듈은 데이터 세트 크기가 변경되지 않는 한 조인 키를 지정하지 않고도 작동합니다.
데이터 세트에서 채점을 수행하기 전에 항상 누락된 값과 null을 확인합니다. 채점의 입력으로 사용되는 데이터에 누락된 값이 있으면 누락된 값이 입력으로 사용됩니다. null이 전파되므로 결과는 일반적으로 누락된 값입니다.
점수 매기기 모듈 목록
Machine Learning Studio(클래식)는 다양한 채점 모듈을 제공합니다. 사용 중인 모델 유형 또는 수행 중인 채점 작업 유형에 따라 하나를 선택합니다.
변환 적용: 데이터 세트에 잘 지정된 데이터 변환을 적용합니다.
이 모듈을 사용하여 데이터 집합에 저장된 프로세스를 적용합니다.
클러스터에 데이터 할당: 기존 학습된 클러스터링 모델을 사용하여 클러스터에 데이터를 할당합니다.
기존 K-평균 클러스터링 모델을 기반으로 새 데이터를 클러스터링하려면 이 모듈을 사용합니다.
이 모듈은 사용되지 않지만 기존 실험에서 계속 사용할 수 있는 클러스터에 할당(사용되지 않음) 모듈을 대체합니다.
매치박스 추천 점수 매기기: Matchbox 추천을 사용하여 데이터 세트에 대한 예측 점수를 매길 수 있습니다.
권장 사항을 생성하거나, 관련 항목 또는 사용자를 찾거나, 등급을 예측하려면 이 모듈을 사용합니다.
모델 점수 매기기: 학습된 분류 또는 회귀 모델에 대한 예측 점수를 매깁니다.
다른 모든 회귀 및 분류 모델과 일부 변칙 검색 모델에 이 모듈을 사용합니다.
관련 작업
- Vowpal Wabbit에 대한 특별 채점 모듈이 제공됩니다. Text Analytics 참조하세요.
- OpenCV 라이브러리를 사용하여 미리 학습된 모델에서 특수한 이미지 클래스에 대해 점수를 매할 수 있습니다.
- 시계열 변칙 검색 모듈은 추세의 잠재적 편차를 나타내는 점수를 생성합니다.
예
Azure AI 갤러리의 이러한 예제는 기본 시나리오에서 고급 시나리오까지 점수 매기기 프로세스를 보여 줍니다.
직접 마케팅에 대한 이진 분류: 예측 값이 마케팅 캠페인에 대한 고객 응답인 시나리오에서 채점의 기본 워크플로를 보여 줍니다.
책 리뷰 예측: 텍스트 데이터 점수 매기기. 로지스틱 회귀 모델을 사용합니다.
개수 Learning: 예측에 카운트 기반 기능화를 사용하는 방법을 보여 줍니다.
Logic Apps 및 Machine Learning 코드 없는 일괄 처리 채점: Azure App Service Logic Apps 기능으로 자동화된 학습 및 채점의 엔드 투 엔드 프로세스를 보여 줍니다.
다음 문서에서는 점수 매기기에 기계 학습 모델을 사용하는 방법에 대한 실제 예제를 제공합니다.