FastForestBinaryTrainer 클래스
정의
중요
일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.
IEstimator<TTransformer> 빠른 포리스트를 사용하여 의사 결정 트리 이진 분류 모델을 학습하기 위한 것입니다.
public sealed class FastForestBinaryTrainer : Microsoft.ML.Trainers.FastTree.RandomForestTrainerBase<Microsoft.ML.Trainers.FastTree.FastForestBinaryTrainer.Options,Microsoft.ML.Data.BinaryPredictionTransformer<Microsoft.ML.Trainers.FastTree.FastForestBinaryModelParameters>,Microsoft.ML.Trainers.FastTree.FastForestBinaryModelParameters>
type FastForestBinaryTrainer = class
inherit RandomForestTrainerBase<FastForestBinaryTrainer.Options, BinaryPredictionTransformer<FastForestBinaryModelParameters>, FastForestBinaryModelParameters>
Public NotInheritable Class FastForestBinaryTrainer
Inherits RandomForestTrainerBase(Of FastForestBinaryTrainer.Options, BinaryPredictionTransformer(Of FastForestBinaryModelParameters), FastForestBinaryModelParameters)
- 상속
설명
이 트레이너를 만들려면 FastForest 또는 FastForest(옵션)를 사용합니다.
입력 및 출력 열
입력 레이블 열 데이터는 Boolean이어야 합니다. 입력 기능 열 데이터는 알려진 크기의 벡터 Single여야 합니다.
이 트레이너는 다음 열을 출력합니다.
출력 열 이름 | 열 유형 | 설명 | |
---|---|---|---|
Score |
Single | 모델에서 계산한 바인딩되지 않은 점수입니다. | |
PredictedLabel |
Boolean | 점수 부호에 따라 예측된 레이블 음수 점수는 false 에 양수 점수는 true 에 매핑됩니다. |
|
Probability |
Single | true를 레이블로 갖는 점수를 보정하여 계산된 확률입니다. 확률 값은 [0, 1] 범위에 있습니다. |
트레이너 특성
기계 학습 작업 | 이진 분류 |
정규화가 필요한가요? | 아니요 |
캐싱이 필요한가요? | 아니요 |
Microsoft.ML 외에도 필요한 NuGet | Microsoft.ML.FastTree |
ONNX로 내보낼 수 있습니다. | 예 |
학습 알고리즘 세부 정보
의사 결정 트리는 입력에 일련의 간단한 테스트를 수행하는 비 파라메트릭 모델입니다. 이 의사 결정 절차는 입력이 처리 중인 인스턴스와 유사했던 학습 데이터 세트에 있는 출력에 매핑됩니다. 적절한 리프 노드에 도달하고 출력 결정이 반환될 때까지 트리의 분기를 통해 각 인스턴스를 재귀적으로 매핑하는 유사성 측정값에 따라 이진 트리 데이터 구조의 각 노드에서 의사 결정이 이루어집니다.
의사 결정 트리를 사용하는 경우의 몇 가지 이점은 다음과 같습니다.
- 학습 및 예측 중에 계산과 메모리 사용량 측면에서 모두 효율적입니다.
- 비선형 의사 결정 경계를 표시할 수 있습니다.
- 통합 기능 선택 및 분류를 수행합니다.
- 잡음 기능이 있는 경우 탄력적입니다.
빠른 포리스트는 임의 포리스트 구현입니다. 이 모델은 의사 결정 트리의 앙상블로 구성되어 있습니다. 의사 결정 포리스트의 각 트리는 예측을 통해 가우스 분포를 출력합니다. 모델의 모든 트리에 대한 결합 분포에 가장 가까운 가우스 분포를 찾기 위해 트리 앙상블에 대해 집계가 수행됩니다. 이 의사 결정 포리스트 분류자는 의사 결정 트리 앙상블로 구성됩니다.
일반적으로 앙상블 모델은 단일 의사 결정 트리에 비해 적용 범위가 넓고 정확도가 높습니다. 의사 결정 포리스트의 각 트리는 가우스 분포를 출력합니다.
자세한 내용은 다음을 참조하세요.
- Wikipedia: 랜덤 포리스트
- 분위수 회귀 포리스트
- From Stumps to Trees to Forests(스텀프에서 트리, 포리스트로 심화)
사용 예제에 대한 링크는 참고 섹션을 참조하세요.
필드
FeatureColumn |
트레이너가 기대하는 기능 열입니다. (다음에서 상속됨 TrainerEstimatorBase<TTransformer,TModel>) |
GroupIdColumn |
순위 트레이너가 예상하는 선택적 groupID 열입니다. (다음에서 상속됨 TrainerEstimatorBaseWithGroupId<TTransformer,TModel>) |
LabelColumn |
트레이너가 기대하는 레이블 열입니다.
|
WeightColumn |
트레이너가 기대하는 체중 열입니다. 가중치가 학습에 사용되지 않음을 나타내는 일 수 |
속성
Info |
IEstimator<TTransformer> 빠른 포리스트를 사용하여 의사 결정 트리 이진 분류 모델을 학습하기 위한 것입니다. (다음에서 상속됨 FastTreeTrainerBase<TOptions,TTransformer,TModel>) |
메서드
Fit(IDataView, IDataView) |
FastForestBinaryTrainer 학습 데이터와 유효성 검사 데이터를 모두 사용하여 학습하고 .BinaryPredictionTransformer<TModel> |
Fit(IDataView) |
를 학습하고 반환합니다 ITransformer. (다음에서 상속됨 TrainerEstimatorBase<TTransformer,TModel>) |
GetOutputSchema(SchemaShape) |
IEstimator<TTransformer> 빠른 포리스트를 사용하여 의사 결정 트리 이진 분류 모델을 학습하기 위한 것입니다. (다음에서 상속됨 TrainerEstimatorBase<TTransformer,TModel>) |
확장 메서드
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
추정기 체인에 '캐싱 검사점'을 추가합니다. 이렇게 하면 다운스트림 추정기가 캐시된 데이터에 대해 학습됩니다. 여러 데이터 전달을 수행하는 트레이너 앞에 캐싱 검사점이 있는 것이 좋습니다. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
추정기가 지정된 경우 호출된 대리 Fit(IDataView) 자를 호출할 래핑 개체를 반환합니다. 예측 도구가 적합한 항목에 대한 정보를 반환하는 것이 중요한 경우가 많습니다. 따라서 Fit(IDataView) 메서드는 일반 ITransformer개체가 아닌 구체적으로 형식화된 개체를 반환합니다. 그러나 동시에 IEstimator<TTransformer> 개체가 많은 파이프라인으로 형성되는 경우가 많으므로 변환기를 가져올 추정기가 이 체인의 어딘가에 묻혀 있는 위치를 통해 EstimatorChain<TLastTransformer> 추정기 체인을 빌드해야 할 수 있습니다. 이 시나리오에서는 이 메서드를 통해 fit이 호출되면 호출될 대리자를 연결할 수 있습니다. |