다음을 통해 공유


2클래스 지원 벡터 머신 구성 요소

이 문서에서는 Azure Machine Learning 디자이너의 구성 요소에 대해 설명합니다.

이 구성 요소를 사용하여 지원 벡터 머신 알고리즘을 기반으로 하는 모델을 만듭니다.

SVM(Support Vector Machine)은 잘 연구된 감독 학습 방법의 클래스입니다. 이 특정 구현은 연속 변수 또는 범주 변수를 기반으로 두 가지 가능한 결과를 예측하는 데 적합합니다.

모델 매개 변수를 정의한 후 학습 구성 요소를 사용하고 레이블 또는 결과 열을 포함하는 태그가 지정된 데이터 세트를 제공하여 모델을 학습시킵니다.

지원 벡터 컴퓨터 정보

지원 벡터 머신은 기계 학습 알고리즘의 초기 버전 중 하나이며, SVM 모델은 정보 검색에서 텍스트 및 이미지 분류에 이르기까지 많은 애플리케이션에서 사용되었습니다. SVM은 분류 및 회귀 작업 모두에 사용할 수 있습니다.

이 SVM 모델은 레이블이 지정된 데이터가 필요한 감독 학습 모델입니다. 학습 과정에서 알고리즘은 입력 데이터를 분석하고 초평면이라는 다차원 기능 공간의 패턴을 인식합니다. 모든 입력 예제는 이 공간에서 포인트로 표시되며, 범주를 가능한 한 넓게 나누고 간격을 지우는 방식으로 출력 범주에 매핑됩니다.

예측을 위해 SVM 알고리즘은 새 예제를 한 범주 또는 다른 범주에 할당하고 동일한 공간에 매핑합니다.

구성 방법

이 모델 형식의 경우 분류자를 학습하는 데 사용하기 전에 데이터 세트를 정규화하는 것이 좋습니다.

  1. 파이프라인에 2클래스 지원 벡터 머신 구성 요소를 추가합니다.

  2. 트레이너 모드 만들기 옵션을 설정하여 모델을 학습시키려는 방법을 지정합니다.

    • 단일 매개 변수: 모델을 어떻게 구성하려는지 아는 경우 특정 값 세트를 인수로 제공할 수 있습니다.

    • 매개 변수 범위: 최적의 매개 변수가 확실하지 않은 경우 모델 하이퍼 매개 변수 조정 구성 요소를 사용하여 최적의 매개 변수를 찾을 수 있습니다. 일부 값 범위를 제공하고 트레이너는 설정의 여러 조합을 반복하여 최상의 결과를 생성하는 값의 조합을 결정합니다.

  3. 반복 횟수의 경우 모델을 빌드할 때 사용되는 반복 횟수를 나타내는 숫자를 입력합니다.

    이 매개 변수는 학습 속도와 정확도 간의 장단 관계를 제어하는 데 사용할 수 있습니다.

  4. 람다의 경우 L1 정규화의 가중치로 사용할 값을 입력합니다.

    이 정규화 계수를 사용하여 모델을 조정할 수 있습니다. 값이 클수록 더 복잡한 모델이 처벌됩니다.

  5. 학습하기 전에 기능을 정규화하려면 옵션을 선택하고 기능을 정규화합니다.

    정규화를 적용하는 경우 학습 전에 데이터 요소가 평균을 중심으로 조정되고 하나의 표준 편차 단위로 확장됩니다.

  6. 계수를 정규화하려면 단위 구에 프로젝트 옵션을 선택합니다.

    단위 공간에 값을 프로젝션하면 학습 전에 데이터 요소가 0으로 가운데에 배치되고 하나의 표준 편차 단위로 크기가 조정됩니다.

  7. 실행 간에 재현성을 보장하려면 난수 시드에서 시드로 사용할 정수 값을 입력합니다. 그러지 않으면 시스템 클록 값이 시드로 사용되어 실행 간에 약간 다른 결과를 초래할 수 있습니다.

  8. 레이블이 지정된 데이터 세트를 연결하고 모델을 학습합니다.

    • 트레이너 모드 만들기단일 매개 변수로 설정하는 경우 태그가 지정된 데이터 세트와 모델 학습 구성 요소를 연결합니다.

    • 트레이너 만들기 모드를 매개 변수 범위설정하는 경우 태그가 지정된 데이터 세트를 연결하고 모델 하이퍼 매개 변수 조정을 사용하여 모델을 학습시킵니다.

    참고 항목

    모델 학습매개 변수 범위를 전달하는 경우 단일 매개 변수 목록의 기본값만 사용합니다.

    매개 변수 값의 단일 집합을 모델 하이퍼 매개 변수 조정 구성 요소에 전달하는 경우 각 매개 변수의 설정 범위를 예상할 때 해당 값을 무시하고 학습자의 기본값을 사용합니다.

    매개 변수 범위 옵션을 선택하고 임의 매개 변수에 대해 단일 값을 입력하면 다른 매개 변수가 값 범위에서 변경되는 경우에도 지정한 단일 값이 스윕 전체에서 사용됩니다.

  9. 파이프라인을 제출합니다.

결과

학습 완료 후:

  • 학습된 모델의 스냅샷을 저장하려면 출력 탭을 모델 학습 구성 요소의 오른쪽 패널에서 선택합니다. 데이터 세트 등록 아이콘을 선택하여 모델을 재사용 가능한 구성 요소로 저장합니다.

  • 모델을 채점에 사용하려면 모델 채점 구성 요소를 파이프라인에 추가합니다.

다음 단계

Azure Machine Learning에서 사용 가능한 구성 요소 집합을 참조하세요.