2클래스 평균 퍼셉트론
중요
Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.
2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.
- ML Studio(클래식)에서 Azure Machine Learning으로 기계 학습 프로젝트 이동에 대한 정보를 참조하세요.
- Azure Machine Learning에 대한 자세한 정보.
ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.
평균 퍼셉트론 이진 분류 모델 만들기
범주: Machine Learning/모델 초기화/분류
모듈 개요
이 문서에서는 Machine Learning Studio(클래식)에서 2클래스 평균 Perceptron 모듈을 사용하여 평균 퍼셉트론 알고리즘을 기반으로 기계 학습 모델을 만드는 방법을 설명합니다.
이 분류 알고리즘은 감독된 학습 방법이며 레이블 열을 포함하는 태그가 지정된 데이터 집합이 필요합니다. 모델 학습 또는 모델 하이퍼 매개 변수 조정에 대한 입력으로 모델 및 태그가 지정된 데이터 세트를 제공하여 모델을 학습시킬 수 있습니다. 그러면 학습된 모델을 사용하여 새로운 입력 예제를 위한 값을 예측할 수 있습니다.
평균 퍼셉트론 모델에 대한 자세한 정보
평균 퍼셉트론 메서드는 신경망의 초기 및 매우 간단한 버전입니다. 이 방법에서 입력은 선형 함수를 기반으로 하는 여러 개의 가능한 출력으로 분류된 후 기능 벡터에서 파생된 가중치 집합과 결합됩니다. 따라서 "퍼셉트론"이라는 이름이 사용됩니다.
보다 단순한 퍼셉트론 모델은 선형으로 구분 가능한 패턴을 학습하는 데 적합한 반면 신경망, 특히 심층 신경망은 더 복잡한 클래스 경계를 모델링할 수 있습니다. 그러나 퍼셉트론은 속도가 더 빠르며 사례를 직렬로 처리하므로 연속 학습에서 사용할 수 있습니다.
2-클래스 평균 퍼셉트론을 구성하는 방법
Studio(클래식)에서 실험에 2클래스 평균 Perceptron 모듈을 추가합니다.
모델을 학습시키는 방법을 트레이너 모드 만들기 옵션을 설정하여 지정합니다.
단일 매개 변수: 모델 구성 방법을 알고 있는 경우 특정 값 집합을 인수로 제공합니다.
매개 변수 범위: 최상의 매개 변수를 잘 모르는 경우 여러 값을 지정하고 모델 하이퍼 매개 변수 조정 모듈을 사용하여 최적의 구성을 찾아 최적의 매개 변수를 찾습니다. 트레이너는 제공한 설정의 여러 조합을 반복하고 최상의 모델을 생성하는 값의 조합을 결정합니다.
학습률에 대해 학습률의 값을 지정합니다. 학습 속도 값은 모델을 테스트하고 수정할 때마다 추측 기울기 하강에 사용되는 단계의 크기를 제어합니다.
학습률 값을 작게 설정하면 로컬 정체에서 중단될 위험이 있으므로 모델을 더 자주 테스트해야 합니다. 단계를 크게 만들면 더 빨리 수렴할 수 있지만 진짜 최소값을 초과할 위험이 있습니다.
최대 반복 횟수에 알고리즘에서 학습 데이터를 검사할 횟수를 입력합니다.
일찍 중지하면 일반화가 향상되는 경우가 많습니다. 반복 횟수를 늘리면 맞춤이 향상되지만 과잉 맞춤될 위험이 있습니다.
난수 초기값의 경우 필요에 따라 시드로 사용할 정수 값을 입력합니다. 각 실행 간에 실험 재현성을 보장하려면 시드를 사용하는 것이 좋습니다.
알 수 없는 범주 수준 허용 옵션을 선택하여 학습 및 유효성 검사 집합에서 알 수 없는 값에 대한 그룹을 만듭니다. 알려진 값에 대해서는 모델의 정확도가 떨어질 수 있지만 새 (알 수 없는) 값은 더 잘 예측할 수 있습니다.
선택을 취소하면 모델에서 학습 데이터에 포함된 값만 수락할 수 있습니다.
학습 데이터 세트 및 학습 모듈 중 하나를 커넥트.
트레이너 모드 만들기를 단일 매개 변수로 설정한 경우 모델 학습 모듈을 사용합니다.
트레이너 모드 만들기를 매개 변수 범위로 설정한 경우 모델 하이퍼 매개 변수 튜닝 모듈을 사용합니다.
참고
모델 학습에 매개 변수 범위를 전달하면 매개 변수 범위 목록의 첫 번째 값만 사용됩니다.
단일 매개 변수 값 세트를 모델 하이퍼 매개 변수 튜닝 모듈에 전달하는 경우 각 매개 변수에 대한 설정 범위를 요청할 때 해당 값을 무시하고 학습자에 대한 기본값을 사용합니다.
매개 변수 범위 옵션을 선택하고 임의 매개 변수의 단일 값을 입력하는 경우 다른 매개 변수가 값 범위에서 변경되더라도 지정한 단일 값은 스윕 전체에서 사용됩니다.
결과
학습 완료 후 다음이 수행됩니다.
- 학습에서 학습한 기능 가중치와 함께 모델의 매개 변수 요약을 보려면 모델 학습 또는 모델 하이퍼 매개 변수 조정 출력을 마우스 오른쪽 단추로 클릭합니다.
예
이 학습 알고리즘을 사용하는 방법에 대한 예제는 Azure AI 갤러리를 참조하세요.
- 이진 분류자 샘플에 대한 교차 유효성 검사: 여러 분류 모델을 비교합니다.
기술 정보
이 섹션에는 구현 세부 정보, 팁, 자주 묻는 질문에 대한 답변이 포함되어 있습니다.
사용 팁
이 모델 유형의 경우에는 데이터 집합을 정규화한 후에 분류자를 학습시키는 데 사용하는 것이 좋습니다. 정규화 옵션은 데이터 정규화를 참조하세요.
평균 퍼셉트론 모델은 신경망의 간소화된 초기 버전입니다. 이와 같이 이 유형은 정확도보다 속도에 목표를 두는 경우 간단한 데이터 집합에서 우수하게 작동합니다. 그러나 원하는 결과를 얻지 못하는 경우 다음 모델 중 하나를 시도합니다.
모듈 매개 변수
Name | 범위 | Type | 기본값 | 설명 |
---|---|---|---|---|
학습 속도 | >=double.Epsilon | Float | 1.0 | 추측 기울기 하강 최적화 프로그램의 초기 학습 속도입니다. |
최대 반복 횟수 | >=1 | 정수 | 10 | 학습 데이터 집합에 대해 수행할 추측 기울기 하강 반복의 횟수입니다. |
난수 초기값 | 모두 | 정수 | 모델에서 사용하는 난수 생성기의 초기값입니다. 기본값을 사용하려면 비워 둡니다. | |
알 수 없는 범주 수준 허용 | 모두 | 부울 | True | True로 설정하면 각 범주 열에 대해 추가 수준을 만듭니다. 학습 데이터 집합에서 사용할 수 없는 테스트 데이터 집합의 모든 수준은 이 추가 수준으로 매핑됩니다. |
출력
Name | 유형 | 설명 |
---|---|---|
학습되지 않은 모델 | ILearner 인터페이스 | One-vs-All 다중 클래스, 모델 학습 또는 모델 간 유효성 검사 모듈에 연결할 수 있는 학습되지 않은 이진 분류 모델입니다. |