Поделиться через


FastTreeBinaryFeaturizationEstimator Класс

Определение

Объект IEstimator<TTransformer> для преобразования входного вектора признаков в признаки на основе дерева.

public sealed class FastTreeBinaryFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastTreeBinaryFeaturizationEstimator = class
    inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastTreeBinaryFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
Наследование
FastTreeBinaryFeaturizationEstimator

Комментарии

Входные и выходные столбцы

Входные данные столбца меток должны иметь тип Boolean. Данные столбца входных признаков должны быть вектором известного Singleразмера .

Этот оценщик выводит следующие столбцы:

Имя выходного столбца Тип столбца Описание
Trees Известный размер вектора Single Выходные значения всех деревьев. Его размер идентичен общему количеству деревьев в модели ансамбля деревьев.
Leaves Известный размер вектора Single 0–1 векторное представление идентификаторов всех листьев, в которые попадает входной вектор признаков. Его размер — это количество общих листьев в модели ансамбля дерева.
Paths Известный размер вектора Single Векторное представление от 0 до 1 для путей, через которые входной вектор признака прошел для достижения листьев. Его размер — это количество неконечных узлов в модели ансамбля дерева.

Эти выходные столбцы являются необязательными, и пользователь может изменить свои имена. Присвойте имена пропущенным столбцам значение NULL, чтобы они не были созданы.

Сведения о прогнозе

Этот оценщик создает несколько выходных столбцов из модели ансамбля дерева. Предположим, что модель содержит только одно дерево принятия решений:

               Node 0
               /    \
             /        \
           /            \
         /                \
       Node 1            Node 2
       /    \            /    \
     /        \        /        \
   /            \     Leaf -3  Node 3
  Leaf -1      Leaf -2         /    \
                             /        \
                            Leaf -4  Leaf -5

Предположим, что вектор входных признаков попадает в Leaf -1. Выходные данные Trees могут быть 1-элементным вектором, где единственным значением является значение принятия решения, переносимое .Leaf -1 Выходные данные Leaves — вектор 0–1. Если достигнутая конечная позиция является $i$-й (индексируется по $-(i+1)$, поэтому первым листом является Leaf -1лист ) в дереве, $i$-е значение в Leaves будет равно 1, а все остальные значения — 0. Выходные данные Paths представляют собой 0-1-е представление узлов, передаваемых до достижения конечной части. Элемент $i$-th в Paths указывает, касается ли $i$-й узел (индексируется по $i$). Например, достижение Leaf -1 привести к $[1, 1, 0, 0]$ в Pathsкачестве . При наличии нескольких деревьев этот оценщик просто объединяет Treess, Leavess Paths, из всех деревьев (информация первого дерева приходит на первое место в сцепленных векторах).

Ссылки на примеры использования см. в разделе См. также.

Методы

Fit(IDataView)

Создает объект , TreeEnsembleModelParameters который сопоставляет столбец, вызываемый InputColumnName в , input с тремя выходными столбцами.

(Унаследовано от TreeEnsembleFeaturizationEstimatorBase)
GetOutputSchema(SchemaShape)

PretrainedTreeFeaturizationEstimator добавляет три столбца с плавающей векторной точкой в inputSchema. При наличии столбца вектора признаков добавленные столбцы являются прогнозируемыми значениями всех деревьев, идентификаторами листов, на которые попадает вектор признаков, и путями к этим листьям.

(Унаследовано от TreeEnsembleFeaturizationEstimatorBase)

Методы расширения

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Добавьте контрольную точку кэширования в цепочку оценщика. Это гарантирует, что подчиненные оценщики будут обучены на основе кэшированных данных. Полезно иметь контрольную точку кэширования перед средствами обучения, которые принимают несколько проходов данных.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

При использовании оценщика возвращается объект-оболочка, который вызывает делегат один раз Fit(IDataView) . Часто важно, чтобы оценщик возвращал сведения о том, что подходит, поэтому Fit(IDataView) метод возвращает конкретно типизированный объект, а не просто общий ITransformer. Однако в то же время IEstimator<TTransformer> они часто формируются в конвейеры с большим количеством объектов, поэтому нам может потребоваться построить цепочку оценщиков, где EstimatorChain<TLastTransformer> оценщик, для которого мы хотим получить преобразователь, похоронен где-то в этой цепочке. Для этого сценария мы можем с помощью этого метода присоединить делегат, который будет вызываться после вызова подходящего метода.

Применяется к

См. также раздел