OneHotHashEncodingEstimator クラス
定義
重要
一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。
カテゴリ値の 1 つ以上の入力列を、ハッシュベースの 1 ホット エンコード ベクターの出力列に変換します。
public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
- 継承
-
OneHotHashEncodingEstimator
- 実装
注釈
エスティメーターの特性
この推定器は、パラメーターをトレーニングするためにデータを確認する必要がありますか? | はい |
入力列のデータ型 | 数値型、ブール型、 テキスト型、または キー 型のスカラーまたはベクター。 |
出力列のデータ型 | キーのスカラーまたはベクトル、または型のSingleベクトル。 |
ONNX にエクスポート可能 | いいえ |
結果として得られる OneHotEncodingTransformer 1 つ以上の入力列は、1 ホット エンコード ベクターの出力列の数に変換されます。ここで、インデックス作成は、値をハッシュし、ハッシュをインデックスとして使用することによって行われます。
多 OneHotEncodingEstimator くの場合、カテゴリデータを機械学習アルゴリズムに提供できる形式に変換するために使用されます。
この変換の出力は、次のように OneHotEncodingEstimator.OutputKind指定されます。
Indicator はインジケーター ベクトルを生成します。 このベクトル内の各スロットは辞書内のカテゴリに対応します。そのため、その長さは構築された辞書のサイズとなります。 ディクショナリに値が見つからない場合、出力はゼロ ベクトルです。
Bag は、各スロットが入力ベクトル内の対応する値の出現回数を格納する 1 つのベクトルを生成します。 このベクター内の各スロットはディクショナリ内の値に対応するため、その長さはビルドされたディクショナリのサイズです。 Indicator 入力 Bag 列の個々のスロットから生成されたビットベクトルを集計する方法は単純に異なります。インジケーターの場合は連結され、バッグの場合は追加されます。 ソース列がスカラーの場合、インジケーターオプションとバッグオプションは同じです。
Key は、列内のキーを KeyDataViewType 生成します。 入力列がベクターの場合、出力にはベクター キー 型が含まれます。ここで、ベクターの各スロットは、入力ベクターのそれぞれのスロットに対応します。 カテゴリがビルドされたディクショナリで見つからない場合は、値 0 が割り当てられます。
Binary は、入力列に存在するディクショナリ内の値を表すバイナリ エンコード ベクターを生成します。 入力列の値がディクショナリに見つからない場合、出力はゼロ ベクトルになります。
OneHotEncodingTransformer は、1 つ以上の列に適用できます。その場合は、適用される列ごとに個別のディクショナリを作成して使用します。
使用例へのリンクについては、「関連項目」セクションを参照してください。
メソッド
Fit(IDataView) |
をトレーニングして返します OneHotHashEncodingTransformer。 |
GetOutputSchema(SchemaShape) |
SchemaShapeトランスフォーマーによって生成されるスキーマの値を返します。 パイプラインでのスキーマの伝達と検証に使用されます。 |
拡張メソッド
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
推定チェーンに "キャッシュ チェックポイント" を追加します。 これにより、ダウンストリーム推定器がキャッシュされたデータに対してトレーニングされるようになります。 複数のデータを受け取るトレーナーの前にキャッシュ チェックポイントを設定すると便利です。 |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
エスティメーターを指定すると、デリゲートが呼 Fit(IDataView) び出されると呼び出されるラップ オブジェクトを返します。 多くの場合、エスティメーターが適合した内容に関する情報を返すことが重要です。そのため Fit(IDataView) 、メソッドは一般的 ITransformerなオブジェクトではなく、具体的に型指定されたオブジェクトを返します。 ただし、同時に、 IEstimator<TTransformer> 多くのオブジェクトを含むパイプラインに形成されることが多いため、トランスフォーマーを取得する推定器がこのチェーンのどこかに埋もれている場所を介して EstimatorChain<TLastTransformer> 、推定器のチェーンを構築する必要がある場合があります。 このシナリオでは、このメソッドを使用して、fit が呼び出されると呼び出されるデリゲートをアタッチできます。 |