순열 기능 중요도
중요
Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.
2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.
- ML Studio(클래식)에서 Azure Machine Learning으로 기계 학습 프로젝트 이동에 대한 정보를 참조하세요.
- Azure Machine Learning에 대한 자세한 정보.
ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.
학습된 모델과 테스트 데이터 집합에 제공된 기능 변수의 순열 기능 중요도 점수를 계산합니다.
범주: 기능 선택 모듈
모듈 개요
이 문서에서는 Machine Learning Studio(클래식)의 순열 기능 중요도 모듈을 사용하여 데이터 세트에 대한 기능 중요도 점수 집합을 계산하는 방법을 설명합니다. 이러한 점수를 사용하여 모델에 사용할 최상의 기능을 결정할 수 있습니다.
이 모듈에서는 기능 값이 한 번에 한 열씩 임의로 순서를 섞고 모델의 성능을 전후로 측정합니다. 성능을 측정하기 위해 제공되는 표준 메트릭 중 하나를 선택할 수 있습니다.
모듈이 반환하는 점수는 순열 뒤 학습된 모델의 변화를 나타냅니다. 중요한 기능은 일반적으로 순서 섞기 프로세스에 더욱 민감하므로 중요도 점수가 더 높아집니다.
이 문서에서는 순열 기능 중요도, 이론적 기반 및 기계 학습의 애플리케이션에 대한 일반적인 개요를 제공합니다. 순열 기능 중요도
순열 기능 중요도를 사용하는 방법
기능 점수 집합을 생성하려면 테스트 데이터 세트뿐만 아니라 이미 학습된 모델이 있어야 합니다.
실험에 순열 기능 중요 도 모듈을 추가합니다. 이 모듈은 기능 선택 범주에서 찾을 수 있습니다.
학습된 모델을 왼쪽 입력에 연결합니다. 모델은 회귀 모델 또는 분류 모델이어야 합니다.
오른쪽 입력에서 모델 학습에 사용되는 데이터 세트와 다른 데이터 세트를 연결합니다. 이 데이터 세트는 학습된 모델을 기반으로 점수를 매기고 기능 값이 변경된 후 모델을 평가하는 데 사용됩니다.
임의 시드의 경우 임의화에 시드로 사용할 값을 입력합니다. 0(기본값)을 지정하면 시스템 클록에 따라 숫자가 생성됩니다.
시드 값은 선택 사항이지만 동일한 실험의 실행에서 재현성을 원하는 경우 값을 제공해야 합니다.
성능을 측정하기 위한 메트릭의 경우 순열 후 모델 품질을 계산할 때 사용할 단일 메트릭을 선택합니다.
Machine Learning Studio(클래식)는 분류 또는 회귀 모델을 평가하는지 여부에 따라 다음 메트릭을 지원합니다.
분류
정확도, 정밀도, 재현율, 평균 로그 손실
회귀
전체 자릿수, 재현율, 평균 절대 오차, 제곱 평균 오차, 상대 절대 오차, 상대 제곱 오차, 결정 계수
이러한 평가 메트릭 및 계산 방법에 대한 자세한 설명은 평가(Evaluate)를 참조하세요.
실험을 실행합니다.
모듈은 기능 열 목록과 관련 점수를 내림차순으로 순위가 매겨진 점수를 출력합니다.
예
Azure AI 갤러리에서 다음 샘플 실험을 참조하세요.
순열 기능 중요도: 이 모듈을 사용하여 순열 중요도 점수 순서로 데이터 세트의 기능 변수 순위를 지정하는 방법을 보여 줍니다.
순열 기능 중요도 모듈 사용: 웹 서비스에서 이 모듈을 사용하는 방법을 보여 줍니다.
기술 정보
이 섹션에서는 자주 묻는 질문에 대한 구현 세부 정보, 팁 및 답변을 제공합니다.
다른 기능 선택 방법과 어떻게 비교하나요?
순열 기능 중요도는 각 기능 열의 값을 한 번에 하나의 열로 임의로 변경한 다음 모델을 평가하여 작동합니다.
순열 기능 중요도에서 제공하는 순위는 종종 모델을 만들기 전에 점수를 계산하는 필터 기반 기능 선택에서 얻는 순위와 다릅니다.
순열 기능 중요도는 기능과 대상 값 간의 연결을 측정하지 않고 각 기능이 모델의 예측에 미치는 영향을 캡처하기 때문입니다.
예상 입력
Name | 유형 | Description |
---|---|---|
학습된 모델 | ILearner 인터페이스 | 학습된 분류 모델 또는 회귀 모델 |
테스트 데이터 | 데이터 테이블 | 기능 값 순열 후 모델의 점수를 매기고 평가하기 위한 테스트 데이터 집합 |
모듈 매개 변수
Name | Type | 범위 | Optional | 기본값 | 설명 |
---|---|---|---|---|---|
무작위 초기값 | 정수 | >=0 | 필수 | 0 | 난수 생성기 시드 값 |
성능 측정을 위한 메트릭 | EvaluationMetricType | 목록에서 선택 | 필수 | 분류 - 정확도 | 순열 후 모델의 가변성을 평가할 때 사용할 메트릭을 선택합니다. |
출력
Name | 유형 | 설명 |
---|---|---|
기능 중요도 | 데이터 테이블 | 선택한 메트릭을 기반으로 기능 중요도 결과가 포함된 데이터 집합 |
예외
예외 | 설명 |
---|---|
오류 0062 | 서로 다른 학습자 유형으로 두 모델을 비교하려고 하면 예외가 발생합니다. |
오류 0024 | 데이터 세트에 레이블 열이 없으면 예외가 발생합니다. |
오류 0105 | 모듈 정의 파일에서 지원되지 않는 매개 변수 유형을 정의하면 throw됩니다. |
오류 0021 | 모듈에 전달된 데이터 세트 중 일부의 행 수가 너무 적으면 예외가 발생합니다. |