데이터 세트에서 열 선택 구성 요소
이 문서에서는 Azure Machine Learning 디자이너의 구성 요소에 대해 설명합니다.
이 구성 요소를 사용하여 다운스트림 작업에서 사용할 열 하위 집합을 선택할 수 있습니다. 이 구성 요소는 원본 데이터 세트에서 열을 물리적으로 제거하지 않습니다. 대신, 데이터베이스 뷰 또는 프로젝션과 유사하게 열 하위 집합을 만듭니다.
이 구성 요소는 다운스트림 작업에 사용할 수 있는 열을 제한해야 하거나 필요 없는 열을 제거하여 데이터 세트의 크기를 줄이려는 경우에 유용합니다.
데이터 세트의 열은 다른 순서로 지정하더라도 원래 데이터와 동일한 순서로 출력됩니다.
사용 방법
이 구성 요소에는 매개 변수가 없습니다. 열 선택기를 사용하여 포함하거나 제외할 열을 선택합니다.
이름으로 열 선택
이 구성 요소에는 이름으로 열을 선택하기 위한 여러 옵션이 있습니다.
필터 및 검색
BY NAME 옵션을 클릭합니다.
이미 채워진 데이터 세트를 연결한 경우 사용 가능한 열 목록이 표시됩니다. 열이 표시되지 않으면 업스트림 구성 요소를 실행하여 열 목록을 확인해야 할 수도 있습니다.
목록을 필터링하려면 검색 상자에 입력합니다. 예를 들어 검색 상자에
w
문자를 입력하면w
문자가 포함된 열 이름을 표시하도록 목록이 필터링됩니다.열을 선택하고 오른쪽 화살표 단추를 클릭하여 선택한 열을 오른쪽 창의 목록으로 이동합니다.
- 연속 열 이름 범위를 선택하려면 Shift + Click을 누릅니 다.
- 선택 영역에 개별 열을 추가하려면 Ctrl+클릭을 누릅니 다.
확인 표시 단추를 클릭하여 저장하고 닫습니다.
다른 규칙과 함께 이름 사용
규칙 사용 옵션을 클릭합니다.
특정 데이터 형식의 열을 표시하는 것과 같은 규칙을 선택합니다.
그런 다음 이름별로 해당 형식의 개별 열을 클릭하여 선택 목록에 추가합니다.
열 이름의 쉼표로 구분된 목록을 입력하거나 붙여넣습니다.
데이터 세트가 넓은 경우 열을 개별적으로 선택하는 대신 인덱스 또는 생성된 이름 목록을 사용하는 것이 더 쉬울 수 있습니다. 목록을 미리 준비한 것으로 가정합니다.
- 규칙 사용 옵션을 클릭합니다.
- 열 없음, 포함을 차례로 선택한 다음, 빨간색 느낌표가 있는 텍스트 상자 안을 클릭합니다.
- 이전에 유효성이 검사된 열 이름의 쉼표로 구분된 목록을 붙여넣거나 입력합니다. 열에 잘못된 이름이 있는 경우 구성 요소를 저장할 수 없으므로 이름을 미리 검사해야 합니다.
이 방법을 사용하여 인덱스 값으로 열 목록을 지정할 수도 있습니다.
유형별로 선택
WITH RULES 옵션을 사용하는 경우 열 선택 영역에 여러 조건을 적용할 수 있습니다. 예를 들어 숫자 데이터 형식의 기능 열만 가져와야 할 수 있습니다.
BEGIN WITH 옵션은 시작점을 결정하며 결과를 이해하는 데 중요합니다.
ALL COLUMNS 옵션을 선택하면 모든 열이 목록에 추가됩니다. 그런 다음 제외 옵션을 사용하여 특정 조건에 맞는 열을 제거해야 합니다.
예를 들어 모든 열로 시작한 다음 이름 또는 형식별로 열을 제거할 수 있습니다.
NO COLUMNS 옵션을 선택하면 열 목록이 비어 시작됩니다. 그런 다음 목록에 열을 추가할 조건을 지정합니다.
여러 규칙을 적용하는 경우 각 조건은 가산적입니다. 예를 들어 열 없이 시작한 다음 모든 숫자 열을 가져오는 규칙을 추가한다고 가정합니다. 자동차 가격 데이터 세트에서 16개의 열이 생성됩니다. 그런 다음, + 기호를 클릭하여 새 조건을 추가하고 모든 기능 포함을 선택합니다. 결과 데이터 세트에는 모든 숫자 열과 일부 문자열 기능 열을 포함한 모든 기능 열이 포함됩니다.
열 인덱스로 선택
열 인덱스는 원래 데이터 세트 내의 열 순서를 나타냅니다.
- 열 번호는 1부터 순차적으로 번호가 매겨집니다.
- 열 범위를 얻으려면 하이픈을 사용합니다.
- 오픈 엔드 사양(예:
1-
허용 안 됨)-3
- 중복 인덱스 값(또는 열 이름)은 허용되지 않으며 오류가 발생할 수 있습니다.
예를 들어 데이터 세트에 8개 이상의 열이 있다고 가정하면 다음 예제 중 하나를 붙여넣어 연속이 아닌 여러 열을 반환할 수 있습니다.
8,1-4,6
1,3-8
1,3-6,4
최종 예제에서는 오류가 발생하지 않지만 4
열의 단일 인스턴스가 반환됩니다.
열 순서 변경
선택 영역에서 중복 및 열 순서 유지 허용 옵션은 빈 목록으로 시작하고 이름 또는 인덱스별로 지정하는 열을 추가합니다. 항상 열을 "자연 순서"로 반환하는 다른 옵션과 달리 이 옵션은 이름을 지정하거나 나열하는 순서대로 열을 출력합니다.
예를 들어 Col1, Col2, Col3 및 Col4 열이 있는 데이터 세트에서 다음 목록 중 하나를 지정하여 열 순서를 바꾸고 열 2를 제외할 수 있습니다.
Col4, Col3, Col1
4,3,1
다음 단계
Azure Machine Learning에서 사용 가능한 구성 요소 집합을 참조하세요.