次の方法で共有


CountFeatureSelectingEstimator クラス

定義

既定値以外の値の数がしきい値以上のスロットを選択します。

public sealed class CountFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type CountFeatureSelectingEstimator = class
    interface IEstimator<ITransformer>
Public NotInheritable Class CountFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
継承
CountFeatureSelectingEstimator
実装

注釈

推定特性

このエスティメーターは、パラメーターをトレーニングするためにデータを確認する必要がありますか? はい
入力列のデータ型 データ型 (Doubleまたはテキストデータ型) のSingleベクターまたはスカラー
出力列のデータ型 入力列と同じ
ONNX にエクスポート可能 はい

この変換では、一連のアグリゲーターを使用して、既定以外で欠落していない各スロット (ベクター要素) の値の数をカウントします (既定値と欠落の定義については、「解説」セクション DataKindを参照してください)。 count 値が指定された count パラメーターより小さい場合、そのスロットは削除されます。 この変換は、 OneHotHashEncodingTransformer. この例では、ハッシュ変換によって生成されたデータがない特徴を削除できます。

たとえば、count パラメーターを 3 に設定し、エスティメーターに合わせてトランスフォーマーを次の Features 列に適用すると、2 番目のスロットに NaN (欠損値)、5、5、0 (既定値) の値が含まれます。これは、スロットに 2 つの非既定値と非欠損値 (つまり、2 つの 5 つの値) しかないためです。 3 番目のスロットは、値 6、6、6、NaN を持っているため、保持されています。そのため、既定値以外と欠落していない 3 つがあります。

特徴
4,NaN,6
4,5,6
4,5,6
4,0,NaN

これは、上記のデータセットが変換後にどのように表示されるかを示しています。

特徴
4,6
4,6
4,6
4,NaN

使用例へのリンクについては、「参照」セクションを参照してください。

メソッド

Fit(IDataView)

をトレーニングして返します ITransformer

GetOutputSchema(SchemaShape)

SchemaShapeトランスフォーマーによって生成されるスキーマの値を返します。 パイプラインでのスキーマの伝達と検証に使用されます。

拡張メソッド

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

エスティメーター チェーンに 'キャッシュ チェックポイント' を追加します。 これにより、ダウンストリームエスティメーターがキャッシュされたデータに対してトレーニングされます。 複数のデータを受け取るトレーナーが渡す前にキャッシュ チェックポイントを設定すると便利です。

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

エスティメーターを指定すると、デリゲートを 1 回 Fit(IDataView) 呼び出すラップ オブジェクトが呼び出されます。 多くの場合、エスティメーターが適合した内容に関する情報を返すことが重要です。そのため Fit(IDataView) 、メソッドは一般的 ITransformerなオブジェクトではなく、具体的に型指定されたオブジェクトを返します。 ただし、同時に、 IEstimator<TTransformer> 多くのオブジェクトを含むパイプラインに形成されることが多いため、トランスフォーマーを取得するエスティメーターがこのチェーンのどこかに埋もれる場所を介して EstimatorChain<TLastTransformer> 、推定器のチェーンを構築する必要がある場合があります。 このシナリオでは、このメソッドを使用して、fit が呼び出されると呼び出されるデリゲートをアタッチできます。

適用対象

こちらもご覧ください