개수 테이블 매개 변수 수정
중요
Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.
2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.
- ML Studio(클래식)에서 Azure Machine Learning으로 기계 학습 프로젝트 이동에 대한 정보를 참조하세요.
- Azure Machine Learning에 대한 자세한 정보.
ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.
개수에서 기능을 만드는 데 사용되는 매개 변수를 수정합니다.
범주: 개수가 있는 Learning
모듈 개요
이 문서에서는 Machine Learning Studio(클래식)의 Count Table Parameters 수정 모듈을 사용하여 개수 테이블에서 기능이 생성되는 방식을 변경하는 방법을 설명합니다.
일반적으로 개수 기반 기능을 만들려면 빌드 계산 변환 을 사용하여 데이터 세트를 처리하고 개수 테이블을 만들고 해당 개수 테이블에서 새로운 기능 집합을 생성합니다.
그러나 개수 테이블을 이미 만든 경우 개수 테이블 매개 변수 수정 모듈을 사용하여 개수 데이터 처리 방법에 대한 정의를 편집할 수 있습니다. 이렇게 하면 데이터 세트를 다시 분석하지 않고도 기존 데이터를 기반으로 다른 개수 기반 통계 집합을 만들 수 있습니다.
Count 매개 변수 수정을 구성하는 방법
변환 그룹에서 수정 할 변환을 찾아 실험에 추가합니다.
이전에 개수 변환을 만든 실험을 실행했어야 합니다.
저장된 변환을 수정하려면: 변환 그룹에서 변환 을 찾아 실험에 추가합니다.
동일한 실험 내에서 만든 개수 변환을 수정하려면: 변환이 저장되지 않았지만 현재 실험에서 출력으로 사용할 수 있는 경우(예: 빌드 계산 변환 모듈의 출력 확인) 모듈을 연결하여 직접 사용할 수 있습니다.
Count 테이블 매개 변수 수정 모듈을 추가하고 변환을 입력으로 연결합니다.
개수 테이블 매개 변수 수정 모듈의 속성 창에서Garbage bin 임계값으로 사용할 값을 입력합니다.
이 값은 개수를 사용하려면 각 기능 값에 대해 찾아야 하는 최소 발생 횟수를 지정합니다. 값의 빈도가 가비지 빈도 임계값보다 작으면 값 레이블 쌍은 불연속 항목으로 계산되지 않습니다. 대신 임계값보다 낮은 개수를 가진 모든 항목은 단일 "가비지 빈"에 배치됩니다.
작은 데이터 세트를 사용하고 동일한 데이터를 계산하고 학습하는 경우 좋은 시작 값은 1입니다.
추가 이전 의사 예제의 경우 포함할 추가 의사 예제의 수를 나타내는 숫자를 입력합니다. 이러한 예제를 제공할 필요는 없습니다. 의사 예제는 이전 배포를 기반으로 생성됩니다.
Laplacian 노이즈 배율의 경우 Laplacian 분포에서 샘플링된 노이즈를 도입하는 데 사용되는 배율을 나타내는 양수 부동 소수점 값을 입력합니다. 배율 값을 설정할 때 허용되는 일부 노이즈 수준이 모델에 통합되므로 모델의 데이터에서 보이지 않는 값의 영향을 받을 가능성이 적습니다.
출력 기능에는 변환에 포함할 개수 기반 기능을 만들 때 사용할 메서드를 선택합니다.
CountsOnly: counts를 사용하여 기능을 만듭니다.
LogOddsOnly: 확률 비율의 로그를 사용하여 기능을 만듭니다.
BothCountsAndLogOdds: 개수와 로그 확률을 모두 사용하여 기능을 만듭니다.
기능을 만들 때 출력의 플래그를 재정의
IsBackOff
하려면 열 무시 옵션을 선택합니다. 이 옵션을 선택하면 열에 중요한 개수 값이 없더라도 개수 기반 기능이 만들어집니다.실험을 실행합니다. 그런 다음 원하는 경우 Count 테이블 매개 변수 수정 의 출력을 새 변환으로 저장할 수 있습니다.
예
이 모듈의 예제는 Azure AI 갤러리를 참조하세요.
counts를 사용한 Learning: 이진 분류: counts 모듈과 함께 학습을 사용하여 이진 분류 모델에 대한 범주 값 열에서 기능을 생성하는 방법을 보여 줍니다.
개수가 있는 Learning: NYC 택시 데이터를 사용한 다중 클래스 분류:샘플은 공개적으로 사용 가능한 NYC 택시 데이터 세트에서 다중 클래스 분류를 수행하기 위해 counts 모듈과 함께 학습을 사용하는 방법을 보여 줍니다. 이 샘플에서는 다중 클래스 로지스틱 회귀 학습자를 사용하여 이 문제를 모델링합니다.
counts를 사용한 Learning: NYC 택시 데이터를 사용한 이진 분류: 공개적으로 사용 가능한 NYC 택시 데이터 세트에서 이진 분류를 수행하기 위해 counts 모듈과 함께 학습을 사용하는 방법을 보여 줍니다. 이 샘플에서는 2클래스 로지스틱 회귀 학습자를 사용하여 이 문제를 모델링합니다.
기술 정보
이 섹션에는 구현 세부 정보, 팁, 자주 묻는 질문에 대한 답변이 포함되어 있습니다.
라플라스 노이즈 척도 매개 변수를 설정하는 경우 동일한 데이터 집합에서 계산과 학습을 수행하는 것이 통계적으로 안전합니다.
예상 입력
Name | 유형 | 설명 |
---|---|---|
계산 변환 | ITransform 인터페이스 | 적용할 계산 변환 |
모듈 매개 변수
Name | Type | 범위 | Optional | 기본값 | 설명 |
---|---|---|---|---|---|
Garbage bin threshold(휴지통 임계값) | Float | >=0.0f | 필수 | 10.0f | 가비지 빈에 대해 열 값을 추천할 임계값입니다. |
Additional prior pseudo examples(추가 이전 의사 예제) | Float | >=0.0f | 필수 | 42.0f | 포함할 이전 배포에 따른 추가 의사 예제 |
Laplacian noise scale(라플라스 노이즈 척도) | Float | >=0.0f | 필수 | 0.0f | 노이즈가 샘플링되는 Laplacian 분포의 배율 |
출력 기능 포함 | OutputFeatureType | 필수 | BothCountsAndLogOdds(개수 및 로그 확률) | 출력할 기능 | |
Ignore back off column(백오프 열 무시) | 부울 | 필수 | false | 출력에서 IsBackOff 열을 무시할지 여부 |
출력
Name | 유형 | 설명 |
---|---|---|
수정된 변환 | ITransform 인터페이스 | 수정된 변환 |
예외
예외 | 설명 |
---|---|
오류 0003 | 하나 이상의 입력이 null이거나 비어 있으면 예외가 발생합니다. |
오류 0086 | 계산 변환이 잘못된 경우 예외가 발생합니다. |
Studio(클래식) 모듈과 관련된 오류 목록은 Machine Learning 오류 코드를 참조하세요.
API 예외 목록은 MACHINE LEARNING REST API 오류 코드를 참조하세요.