표시기 값으로 변환
중요
Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.
2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.
- ML Studio(클래식)에서 Azure Machine Learning으로 기계 학습 프로젝트 이동에 대한 정보를 참조하세요.
- Azure Machine Learning에 대한 자세한 정보.
ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.
열의 범주 값을 지표 값으로 변환
범주: 데이터 변환/조작
모듈 개요
이 문서에서는 Machine Learning Studio(클래식)에서 표시기 값으로 변환 모듈을 사용하는 방법을 설명합니다. 이 모듈의 목적은 범주 값이 포함된 열을 기계 학습 모델의 기능으로 더 쉽게 사용할 수 있는 일련의 이진 표시기 열로 변환하는 것입니다.
표시기 값으로 변환을 구성하는 방법
표시기 값으로 변환 모듈을 Machine Learning 실험에 추가하고 변환하려는 열이 포함된 데이터 세트에 연결합니다. 이 모듈은 조작 범주의 데이터 변환 아래에서 찾을 수 있습니다.
열 선택기를 사용하여 하나 이상의 범주 열을 선택합니다.
선택한 열이 범주인지 확인하려면 실험에서 표시기 값으로 변환하기 전에 메타데이터 편집을 사용하여 대상 열을 범주로 표시합니다.
새 부울 열만 출력하려면 범주 열 덮어쓰기 옵션을 선택합니다.
기본적으로 이 옵션은 꺼져 있으므로 관련 표시기 열과 함께 원본인 범주 열을 볼 수 있습니다.
팁
덮어쓰기 옵션을 선택하는 경우 원본 열이 실제로 삭제되거나 수정되지는 않습니다. 대신 새 열이 생성되고 출력 데이터 세트에 표시되며 원본 열은 작업 영역에서 사용할 수 있는 상태로 유지됩니다. 원본 데이터를 확인해야 하는 경우 언제든지 열 추가 모듈을 사용하여 원본 열을 다시 추가할 수 있습니다.
실험을 실행합니다.
결과
예를 들어 서버에 실패 확률이 높거나 중간 또는 낮은지 여부를 나타내는 점수가 있는 열이 있다고 가정합니다.
서버 ID입니다. | 실패 점수 |
---|---|
10301 | 낮음 |
10302 | 중간 |
10303 | 높음 |
표시기 값으로 변환을 적용하면 레이블의 단일 열이 부울 값을 포함하는 여러 열로 변환됩니다.
서버 ID입니다. | 실패 점수 - 낮음 | 실패 점수 - 보통 | 실패 점수 - 높음 |
---|---|---|---|
10301 | 1 | 0 | 0 |
10302 | 0 | 1 | 0 |
10303 | 0 | 0 | 1 |
변환의 작동 방식은 다음과 같습니다.
위험을 설명하는 실패 점수 열에는 세 가지 값(높음, 보통, 중간)만 가능하며 누락 값은 없습니다. 따라서 정확히 세 개의 새 열이 만들어집니다.
새 표시기 열의 이름은 <원본 열> - <데이터 값> 패턴을 사용하여 원본 열의 열 제목과 값에 따라 지정됩니다.
정확히 하나의 표시기 열에는 1, 다른 모든 표시기 열에는 0이 있어야 합니다. 각 서버에는 하나의 위험 등급만 있을 수 있기 때문입니다.
이제 세 개의 표시기 열을 기능으로 사용하고 다른 위험 수준과 연결된 다른 속성과의 상관 관계를 분석할 수 있습니다.
예
이 모듈의 사용 방법에 대한 예제를 보려면 Azure AI 갤러리를 참조하세요.
유방암 탐지: 환자는 환자 ID 번호에 따라 그룹으로 범주화되고 지표 값 은 환자가 속한 그룹에 플래그를 지정하는 데 사용됩니다. 그런 후에 모델 점수를 매길 때 그룹 표시기를 사용합니다.
직접 마케팅: 확률은 수학 적용 연산을 사용하여 상수와 비교되며, 점수가 상수 위 또는 아래에 있는지 여부를 나타내는 예/아니요 값은 새 표시기 열로 바꿉니다.
네트워크 침입 검색: 로그 데이터는 Azure Storage에서 로드됩니다. 클래스 변수(예를 들어, 공격이 루트킷 또는 버퍼풀인 경우 설명)는 범주 열로 변환된 다음 여러 지표 값으로 확장됩니다.
기술 정보
이 섹션에는 구현 세부 정보, 팁, 자주 묻는 질문에 대한 답변이 포함되어 있습니다.
사용 팁
범주로 표시된 열만 표시기 열로 변환할 수 있습니다. 이 오류가 표시되면 선택한 열 중 하나가 범주가 아닐 수 있습니다.
오류 0056: 이름이 <열 이름>인 열이 허용되는 범주에 없습니다.
기본적으로 대부분의 문자열 열은 문자열 기능으로 처리되므로 메타데이터 편집을 사용하여 명시적으로 범주로 표시해야 합니다.
범주 열을 하나 이상 선택하지 않으면 오류가 표시됩니다.
표시기 열로 변환할 수 있는 열 수에는 제한이 없습니다. 그러나 값의 각 열은 여러 표시기 열을 생성할 수 있으므로 한 번에 몇 개의 열만 변환하고 검토할 수 있습니다.
열에 누락 값이 포함된 경우 누락된 범주에 대한 별도의 표시기 열이 생성되며 이름은 <원본 열> - 누락입니다.
표시기 값으로 변환하는 열에 숫자가 포함된 경우 다른 기능 열처럼 범주로 표시되어야 합니다. 작업을 완료한 후에는 숫자를 불연속 값으로 처리합니다. 예를 들어 25~30 사이의 MPG 값이 있는 숫자 열이 있는 경우 각 불연속 값에 대해 새 표시기 열이 생성됩니다.
Make 고속도로 mpg - 25 고속도로 mpg - 26 고속도로 mpg - 27 고속도로 mpg - 28 고속도로 mpg - 29 고속도로 mpg - 30 알파 로미오 0 0 0 0 0 1 막대한 수의 표시기 열을 가져오지 않도록 먼저 열의 값 수를 확인하고 데이터를 적절하게 bin 또는 정량화하는 것이 좋습니다.
예상 입력
Name | 유형 | 설명 |
---|---|---|
데이터 세트 | 데이터 테이블 | 범주 열이 포함된 데이터 집합입니다. |
모듈 매개 변수
Name | 범위 | Type | 기본값 | 설명 |
---|---|---|---|---|
변환할 범주 열 | 모두 | ColumnSelection | 지표 행렬로 변환할 범주 열을 선택합니다. | |
범주 열 덮어쓰기 | 모두 | 부울 | false | True로 설정하면 선택한 범주 열을 덮어쓰고 그렇지 않으면 결과 표시기 행렬을 데이터 집합에 추가합니다. |
출력
Name | 유형 | 설명 |
---|---|---|
결과 데이터 집합 | 데이터 테이블 | 표시기 행렬로 변환된 범주 열을 포함하는 데이터 집합입니다. |