Sdílet prostřednictvím


OneHotHashEncodingEstimator Třída

Definice

Převede jeden nebo více vstupních sloupců kategorických hodnot na tolik výstupních sloupců vektorů zakódovaných pomocí hodnoty hash.

public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
    interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
Dědičnost
OneHotHashEncodingEstimator
Implementuje

Poznámky

Charakteristiky estimátoru

Potřebuje tento estimátor podívat se na data, aby vytrénovala jeho parametry? Yes
Datový typ vstupního sloupce Skalární nebo vektor číselného, logického, textového nebo klíčového typu
Datový typ výstupního sloupce Skalární nebo vektor klíče nebo vektor typu Single .
Exportovatelné do ONNX No

Výsledná funkce OneHotEncodingTransformer převede jeden nebo více vstupních sloupců na tolik výstupních sloupců vektorů s kódováním typu 1-hot, kde indexování provádí hashováním hodnoty a použitím hodnoty hash jako indexu.

Často OneHotEncodingEstimator se používá k převodu kategorických dat do formuláře, který lze poskytnout algoritmu strojového učení.

Výstup této transformace je určen:OneHotEncodingEstimator.OutputKind

  • Indicator vytvoří vektor ukazatele. Každý slot v tomto vektoru odpovídá kategorii ve slovníku, takže jeho délka je velikost sestaveného slovníku. Pokud se ve slovníku nenajde hodnota, výstup je nulový vektor.

  • Bag vytvoří jeden vektor, který každý slot ukládá počet výskytů odpovídající hodnoty ve vstupním vektoru. Každý slot v tomto vektoru odpovídá hodnotě ve slovníku, takže jeho délka je velikost vytvořeného slovníku. Indicator a Bag liší se jednoduše v tom, jak jsou bitové vektory generované z jednotlivých slotů ve vstupním sloupci agregované: pro indikátor, které jsou zřetězeny a pro bag se přidávají. Pokud je zdrojovým sloupcem skalár, možnosti Indikátor a Taška jsou identické.

  • Key vytvoří klíče ve sloupci KeyDataViewType . Pokud je vstupní sloupec vektor, výstup obsahuje typ vektorového klíče , kde každý slot vektoru odpovídá příslušnému slotu vstupního vektoru. Pokud se v integrovaném slovníku nenajde kategorie, přiřadí se nula hodnoty.

  • Binary vytvoří binární zakódovaný vektor, který představuje hodnoty nalezené ve slovníku, které jsou přítomné ve vstupním sloupci. Pokud ve slovníku není nalezena hodnota ve vstupním sloupci, je výstup nulový vektor.

OneHotEncodingTransformer lze použít na jeden nebo více sloupců, v takovém případě sestaví a použije samostatný slovník pro každý sloupec, na který se použije.

Odkazy na příklady použití najdete v části Viz také.

Metody

Fit(IDataView)

Vlaky a vrací hodnotu OneHotHashEncodingTransformer.

GetOutputSchema(SchemaShape)

SchemaShape Vrátí schéma, které bude vytvořen transformátorem. Používá se pro šíření a ověřování schématu v kanálu.

Metody rozšíření

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Připojte k řetězci estimátoru kontrolní bod ukládání do mezipaměti. Tím zajistíte, aby podřízené estimátory byly vytrénovány proti datům uloženým v mezipaměti. Před průchodem více dat je užitečné mít kontrolní bod ukládání do mezipaměti.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Vzhledem k estimátoru vraťte zalamovací objekt, který zavolá delegáta jednou Fit(IDataView) . Často je důležité, aby odhadovač vrátil informace o tom, co bylo vhodné, což je důvod, proč Fit(IDataView) metoda vrací konkrétně typ objekt, nikoli jen obecné ITransformer. Ve stejnou dobu se však často vytvářejí do kanálů s mnoha objekty, takže možná budeme muset vytvořit řetězec estimátorů, kde EstimatorChain<TLastTransformer> je odhadovač, IEstimator<TTransformer> pro který chceme získat transformátor, zakopán někde v tomto řetězci. Pro tento scénář můžeme prostřednictvím této metody připojit delegáta, který bude volána po zavolání fit.

Platí pro

Viz také