개수 변환 병합
중요
Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.
2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.
- ML Studio(클래식)에서 Azure Machine Learning으로 기계 학습 프로젝트 이동에 대한 정보를 참조하세요.
- Azure Machine Learning에 대한 자세한 정보.
ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.
개수 테이블을 기반으로 기능 집합을 만듭니다.
범주: 개수가 있는 Learning
모듈 개요
이 문서에서는 Machine Learning Studio(클래식)에서 병합 개수 변환 모듈을 사용하여 두 개수 기반 기능 집합을 결합하는 방법을 설명합니다. 관련 개수 및 기능의 두 집합을 병합하면 기능의 적용 범위 및 배포를 잠재적으로 개선할 수 있습니다.
개수의 Learning 카디널리티 기능이 높은 대규모 데이터 집합에서 특히 유용합니다. 데이터 세트를 다시 처리하지 않고도 여러 데이터 세트를 개수 기반 기능 집합으로 결합할 수 있으므로 매우 큰 데이터 세트에 대한 통계를 쉽게 수집하고 새 데이터 세트에 적용할 수 있습니다. 예를 들어 개수 테이블을 사용하여 테라바이트 단위의 데이터에 대한 정보를 수집할 수 있습니다. 이러한 통계를 다시 사용하여 작은 데이터 집합에서 예측 모델의 정확도를 향상시킬 수 있습니다.
두 개수 기반 기능 집합을 병합하려면 스키마가 동일한 테이블을 사용하여 기능을 만들어야 합니다. 즉, 두 집합 모두 동일한 열을 사용해야 하며 이름과 데이터 형식이 같아야 합니다.
병합 개수 변환을 구성하는 방법
병합 개수 변환을 사용하려면 하나 이상의 개수 기반 변환을 만들었어야 하며 해당 변환은 작업 영역에 있어야 합니다. 다른 실험에서 개수 기반 변환을 저장한 경우 변환 그룹을 확인 합니다 . 현재 실험에서 변환을 만든 경우 다음 모듈의 출력을 연결합니다.
계산 변환을 빌드합니다. 원본 데이터에서 새 개수 기반 변환을 만듭니다.
Count 테이블 매개 변수를 수정합니다. 기존 개수 변환을 입력으로 사용하고 업데이트된 변환을 출력합니다.
Count 테이블을 가져옵니다. 이 모듈은 카운트 기반 학습을 사용한 이전 실험과의 이전 버전과의 호환성을 지원합니다. Import Count 테이블을 사용하여 데이터 세트의 값 분포를 분석한 다음 사용되지 않는 Count Featurizer 모듈을 사용하여 값을 기능으로 변환한 경우 가져오기 개수 테이블을 사용하여 결과를 변환으로 변환합니다.
실험에 Merge Count Transform 모듈을 추가하고 변환을 각 입력에 연결합니다.
팁
두 번째 변환은 선택적 입력입니다. 동일한 변환을 두 번 연결하거나 두 번째 입력 포트에서 아무 것도 연결할 수 없습니다.
두 번째 데이터 세트를 첫 번째 데이터 세트와 동일하게 가중치를 적용하지 않으려면 감쇠 계수 값을 지정합니다. 입력한 값은 두 번째 변환의 기능 집합에 가중치를 적용하는 방법을 나타냅니다.
예를 들어 기본값인 1은 두 기능 집합에 동일하게 가중치를 적용합니다. 값이 .5이면 두 번째 집합의 기능이 첫 번째 집합에 있는 기능의 절반 가중치를 갖습니다.
필요에 따라 변환 적용 모듈의 인스턴스를 추가하고 변환을 데이터 세트에 적용합니다.
예
이 모듈을 사용하는 방법에 대한 예제는 Azure AI 갤러리를 참조하세요.
counts를 사용한 Learning: 이진 분류: counts 모듈과 함께 학습을 사용하여 이진 분류 모델에 대한 범주 값 열에서 기능을 생성하는 방법을 보여 줍니다.
counts를 사용한 Learning: NYC 택시 데이터를 사용한 다중 클래스 분류: 공개적으로 사용 가능한 NYC 택시 데이터 세트에서 다중 클래스 분류를 수행하기 위해 counts 모듈과 함께 학습을 사용하는 방법을 보여 줍니다. 이 샘플에서는 다중 클래스 로지스틱 회귀 학습자를 사용하여 이 문제를 모델링합니다.
Counts가 있는 Learning: NYC 택시 데이터를 사용한 이진 분류: 공개적으로 사용 가능한 NYC 택시 데이터 세트에서 이진 분류를 수행하기 위해 counts 모듈과 함께 학습을 사용하는 방법을 보여 줍니다. 이 샘플에서는 2클래스 로지스틱 회귀 학습자를 사용하여 문제를 모델링합니다.
예상 입력
Name | 유형 | 설명 |
---|---|---|
이전 계산 변환 | ITransform 인터페이스 | 편집할 계산 변환 |
새 계산 변환 | ITransform 인터페이스 | 추가할 계산 변환(선택 사항) |
모듈 매개 변수
Name | Type | 범위 | 옵션 | Description | 기본값 |
---|---|---|---|---|---|
감쇠 계수 | Float | 필수 | 1.0f | 오른쪽 입력 포트에서 계산 변환에 곱할 감쇠 계수 |
출력
Name | 유형 | 설명 |
---|---|---|
병합된 계산 변환 | ITransform 인터페이스 | 병합된 변환 |
예외
예외 | 설명 |
---|---|
오류 0003 | 하나 이상의 입력이 null이거나 비어 있으면 예외가 발생합니다. |
오류 0086 | 계산 변환이 잘못된 경우 예외가 발생합니다. |