다음을 통해 공유


FastForestBinaryFeaturizationEstimator 클래스

정의

IEstimator<TTransformer> 입력 기능 벡터를 트리 기반 기능으로 변환하는 입니다.

public sealed class FastForestBinaryFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastForestBinaryFeaturizationEstimator = class
    inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastForestBinaryFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
상속
FastForestBinaryFeaturizationEstimator

설명

입력 및 출력 열

입력 레이블 열 데이터는 Boolean이어야 합니다. 입력 기능 열 데이터는 의 Single알려진 크기 벡터여야 합니다.

이 예측 도구는 다음 열을 출력합니다.

출력 열 이름 열 유형 Description
Trees 의 알려진 크기 벡터 Single 모든 트리의 출력 값입니다. 해당 크기는 트리 앙상블 모델의 총 트리 수와 동일합니다.
Leaves 의 알려진 크기 벡터 Single 입력 기능 벡터가 속하는 모든 리프의 ID에 대한 0-1 벡터 표현입니다. 해당 크기는 트리 앙상블 모델의 총 잎 수입니다.
Paths 의 알려진 크기 벡터 Single 입력 기능 벡터가 나뭇잎에 도달하기 위해 통과한 경로에 대한 0-1 벡터 표현입니다. 해당 크기는 트리 앙상블 모델의 리프가 아닌 노드 수입니다.

이러한 출력 열은 모두 선택 사항이며 사용자는 이름을 변경할 수 있습니다. 건너뛴 열의 이름이 생성되지 않도록 null로 설정하세요.

예측 세부 정보

이 예측 도구는 트리 앙상블 모델에서 여러 출력 열을 생성합니다. 모델에 의사 결정 트리가 하나만 포함되어 있다고 가정합니다.

               Node 0
               /    \
             /        \
           /            \
         /                \
       Node 1            Node 2
       /    \            /    \
     /        \        /        \
   /            \     Leaf -3  Node 3
  Leaf -1      Leaf -2         /    \
                             /        \
                            Leaf -4  Leaf -5

입력 기능 벡터가 에 속한다고 가정합니다 Leaf -1. 출력 Trees 은 1 요소 벡터일 수 있습니다. 여기서 유일한 값은 에 의해 Leaf -1전달되는 의사 결정 값입니다. 출력 Leaves 은 0-1 벡터입니다. 도달한 리프가 트리의 $i$-th($-(i+1)$로 인덱싱되어 첫 번째 리프가 ) 리프인 Leaf -1경우 의 $i$-th 값 Leaves 은 1이고 다른 모든 값은 0이 됩니다. 출력 Paths 은 리프에 도달하기 전에 통과된 노드의 0-1 표현입니다. 의 Paths $i$-th 요소는 $i$th 노드($i$로 인덱싱됨)가 터치되는지를 나타냅니다. 예를 들어 $[1, 1, 0, 0]$에 도달 Leaf -1 하면 가 로 표시됩니다 Paths. 여러 트리가 있는 경우 이 예측 도구는 모든 트리에서 의 LeavesPaths를 연결Trees합니다(첫 번째 트리의 정보는 연결된 벡터에서 먼저 제공됨).

사용 예제에 대한 링크는 참고 섹션을 참조하세요.

메서드

Fit(IDataView)

TreeEnsembleModelParameters 에서 호출 InputColumnName 된 열을 세 개의 출력 열에 input 매핑하는 을 생성합니다.

(다음에서 상속됨 TreeEnsembleFeaturizationEstimatorBase)
GetOutputSchema(SchemaShape)

PretrainedTreeFeaturizationEstimator 는 3개의 float-vector 열을 에 inputSchema추가합니다. 기능 벡터 열이 지정된 경우 추가된 열은 모든 트리의 예측 값, 기능 벡터에 속하는 리프 ID 및 해당 리프에 대한 경로입니다.

(다음에서 상속됨 TreeEnsembleFeaturizationEstimatorBase)

확장 메서드

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

추정기 체인에 '캐싱 검사점'을 추가합니다. 이렇게 하면 다운스트림 예측 도구가 캐시된 데이터에 대해 학습됩니다. 여러 데이터 전달을 수행하는 트레이너 앞에 캐싱 검사점이 있으면 도움이 됩니다.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

예측 도구가 지정된 경우 가 호출되면 Fit(IDataView) 대리자를 호출할 래핑 개체를 반환합니다. 예측 도구에서 적합한 항목에 대한 정보를 반환하는 것이 중요한 경우가 많습니다. 따라서 Fit(IDataView) 메서드는 일반 ITransformer가 아닌 구체적으로 형식화된 개체를 반환합니다. 그러나 동시에 IEstimator<TTransformer> 많은 개체가 있는 파이프라인으로 형성되는 경우가 많으므로 변환기를 가져오려는 추정기가 이 체인의 어딘가에 묻혀 있는 위치를 통해 EstimatorChain<TLastTransformer> 예측 도구 체인을 빌드해야 할 수 있습니다. 이 시나리오에서는 fit이 호출되면 호출될 대리자를 이 메서드를 통해 연결할 수 있습니다.

적용 대상

추가 정보