다음을 통해 공유


데이터 세트에서 열 선택 구성 요소

이 문서에서는 Azure Machine Learning 디자이너의 구성 요소에 대해 설명합니다.

이 구성 요소를 사용하여 다운스트림 작업에서 사용할 열 하위 집합을 선택할 수 있습니다. 이 구성 요소는 원본 데이터 세트에서 열을 물리적으로 제거하지 않습니다. 대신, 데이터베이스 또는 프로젝션과 유사하게 열 하위 집합을 만듭니다.

이 구성 요소는 다운스트림 작업에 사용할 수 있는 열을 제한해야 하거나 필요 없는 열을 제거하여 데이터 세트의 크기를 줄이려는 경우에 유용합니다.

데이터 세트의 열은 다른 순서로 지정하더라도 원래 데이터와 동일한 순서로 출력됩니다.

사용 방법

이 구성 요소에는 매개 변수가 없습니다. 열 선택기를 사용하여 포함하거나 제외할 열을 선택합니다.

이름으로 열 선택

이 구성 요소에는 이름으로 열을 선택하기 위한 여러 옵션이 있습니다.

  • 필터 및 검색

    BY NAME 옵션을 클릭합니다.

    이미 채워진 데이터 세트를 연결한 경우 사용 가능한 열 목록이 표시됩니다. 열이 표시되지 않으면 업스트림 구성 요소를 실행하여 열 목록을 확인해야 할 수도 있습니다.

    목록을 필터링하려면 검색 상자에 입력합니다. 예를 들어 검색 상자에 w 문자를 입력하면 w 문자가 포함된 열 이름을 표시하도록 목록이 필터링됩니다.

    열을 선택하고 오른쪽 화살표 단추를 클릭하여 선택한 열을 오른쪽 창의 목록으로 이동합니다.

    • 연속 열 이름 범위를 선택하려면 Shift + Click을 누릅니 .
    • 선택 영역에 개별 열을 추가하려면 Ctrl+클릭을 누릅니 .

    확인 표시 단추를 클릭하여 저장하고 닫습니다.

  • 다른 규칙과 함께 이름 사용

    규칙 사용 옵션을 클릭합니다.

    특정 데이터 형식의 열을 표시하는 것과 같은 규칙을 선택합니다.

    그런 다음 이름별로 해당 형식의 개별 열을 클릭하여 선택 목록에 추가합니다.

  • 열 이름의 쉼표로 구분된 목록을 입력하거나 붙여넣습니다.

    데이터 세트가 넓은 경우 열을 개별적으로 선택하는 대신 인덱스 또는 생성된 이름 목록을 사용하는 것이 더 쉬울 수 있습니다. 목록을 미리 준비한 것으로 가정합니다.

    1. 규칙 사용 옵션을 클릭합니다.
    2. 열 없음, 포함을 차례로 선택한 다음, 빨간색 느낌표가 있는 텍스트 상자 안을 클릭합니다.
    3. 이전에 유효성이 검사된 열 이름의 쉼표로 구분된 목록을 붙여넣거나 입력합니다. 열에 잘못된 이름이 있는 경우 구성 요소를 저장할 수 없으므로 이름을 미리 검사해야 합니다.

    이 방법을 사용하여 인덱스 값으로 열 목록을 지정할 수도 있습니다.

유형별로 선택

WITH RULES 옵션을 사용하는 경우 열 선택 영역에 여러 조건을 적용할 수 있습니다. 예를 들어 숫자 데이터 형식의 기능 열만 가져와야 할 수 있습니다.

BEGIN WITH 옵션은 시작점을 결정하며 결과를 이해하는 데 중요합니다.

  • ALL COLUMNS 옵션을 선택하면 모든 열이 목록에 추가됩니다. 그런 다음 제외 옵션을 사용하여 특정 조건에 맞는 열을 제거해야 합니다.

    예를 들어 모든 열로 시작한 다음 이름 또는 형식별로 열을 제거할 수 있습니다.

  • NO COLUMNS 옵션을 선택하면 열 목록이 비어 시작됩니다. 그런 다음 목록에 열을 추가할 조건을 지정합니다.

    여러 규칙을 적용하는 경우 각 조건은 가산적입니다. 예를 들어 열 없이 시작한 다음 모든 숫자 열을 가져오는 규칙을 추가한다고 가정합니다. 자동차 가격 데이터 세트에서 16개의 열이 생성됩니다. 그런 다음, + 기호를 클릭하여 새 조건을 추가하고 모든 기능 포함을 선택합니다. 결과 데이터 세트에는 모든 숫자 열과 일부 문자열 기능 열을 포함한 모든 기능 열이 포함됩니다.

열 인덱스로 선택

열 인덱스는 원래 데이터 세트 내의 열 순서를 나타냅니다.

  • 열 번호는 1부터 순차적으로 번호가 매겨집니다.
  • 열 범위를 얻으려면 하이픈을 사용합니다.
  • 오픈 엔드 사양(예: 1- 허용 안 됨)-3
  • 중복 인덱스 값(또는 열 이름)은 허용되지 않으며 오류가 발생할 수 있습니다.

예를 들어 데이터 세트에 8개 이상의 열이 있다고 가정하면 다음 예제 중 하나를 붙여넣어 연속이 아닌 여러 열을 반환할 수 있습니다.

  • 8,1-4,6
  • 1,3-8
  • 1,3-6,4

최종 예제에서는 오류가 발생하지 않지만 4 열의 단일 인스턴스가 반환됩니다.

열 순서 변경

선택 영역에서 중복 및 열 순서 유지 허용 옵션은 빈 목록으로 시작하고 이름 또는 인덱스별로 지정하는 열을 추가합니다. 항상 열을 "자연 순서"로 반환하는 다른 옵션과 달리 이 옵션은 이름을 지정하거나 나열하는 순서대로 열을 출력합니다.

예를 들어 Col1, Col2, Col3 및 Col4 열이 있는 데이터 세트에서 다음 목록 중 하나를 지정하여 열 순서를 바꾸고 열 2를 제외할 수 있습니다.

  • Col4, Col3, Col1
  • 4,3,1

다음 단계

Azure Machine Learning에서 사용 가능한 구성 요소 집합을 참조하세요.