OneHotHashEncodingEstimator Třída
Definice
Důležité
Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.
Převede jeden nebo více vstupních sloupců kategorických hodnot na tolik výstupních sloupců vektorů zakódovaných pomocí hodnoty hash.
public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
- Dědičnost
-
OneHotHashEncodingEstimator
- Implementuje
Poznámky
Charakteristiky estimátoru
Potřebuje tento estimátor podívat se na data, aby vytrénovala jeho parametry? | Yes |
Datový typ vstupního sloupce | Skalární nebo vektor číselného, logického, textového nebo klíčového typu |
Datový typ výstupního sloupce | Skalární nebo vektor klíče nebo vektor typu Single . |
Exportovatelné do ONNX | No |
Výsledná funkce OneHotEncodingTransformer převede jeden nebo více vstupních sloupců na tolik výstupních sloupců vektorů s kódováním typu 1-hot, kde indexování provádí hashováním hodnoty a použitím hodnoty hash jako indexu.
Často OneHotEncodingEstimator se používá k převodu kategorických dat do formuláře, který lze poskytnout algoritmu strojového učení.
Výstup této transformace je určen:OneHotEncodingEstimator.OutputKind
Indicator vytvoří vektor ukazatele. Každý slot v tomto vektoru odpovídá kategorii ve slovníku, takže jeho délka je velikost sestaveného slovníku. Pokud se ve slovníku nenajde hodnota, výstup je nulový vektor.
Bag vytvoří jeden vektor, který každý slot ukládá počet výskytů odpovídající hodnoty ve vstupním vektoru. Každý slot v tomto vektoru odpovídá hodnotě ve slovníku, takže jeho délka je velikost vytvořeného slovníku. Indicator a Bag liší se jednoduše v tom, jak jsou bitové vektory generované z jednotlivých slotů ve vstupním sloupci agregované: pro indikátor, které jsou zřetězeny a pro bag se přidávají. Pokud je zdrojovým sloupcem skalár, možnosti Indikátor a Taška jsou identické.
Key vytvoří klíče ve sloupci KeyDataViewType . Pokud je vstupní sloupec vektor, výstup obsahuje typ vektorového klíče , kde každý slot vektoru odpovídá příslušnému slotu vstupního vektoru. Pokud se v integrovaném slovníku nenajde kategorie, přiřadí se nula hodnoty.
Binary vytvoří binární zakódovaný vektor, který představuje hodnoty nalezené ve slovníku, které jsou přítomné ve vstupním sloupci. Pokud ve slovníku není nalezena hodnota ve vstupním sloupci, je výstup nulový vektor.
OneHotEncodingTransformer lze použít na jeden nebo více sloupců, v takovém případě sestaví a použije samostatný slovník pro každý sloupec, na který se použije.
Odkazy na příklady použití najdete v části Viz také.
Metody
Fit(IDataView) |
Vlaky a vrací hodnotu OneHotHashEncodingTransformer. |
GetOutputSchema(SchemaShape) |
SchemaShape Vrátí schéma, které bude vytvořen transformátorem. Používá se pro šíření a ověřování schématu v kanálu. |
Metody rozšíření
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Připojte k řetězci estimátoru kontrolní bod ukládání do mezipaměti. Tím zajistíte, aby podřízené estimátory byly vytrénovány proti datům uloženým v mezipaměti. Před průchodem více dat je užitečné mít kontrolní bod ukládání do mezipaměti. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Vzhledem k estimátoru vraťte zalamovací objekt, který zavolá delegáta jednou Fit(IDataView) . Často je důležité, aby odhadovač vrátil informace o tom, co bylo vhodné, což je důvod, proč Fit(IDataView) metoda vrací konkrétně typ objekt, nikoli jen obecné ITransformer. Ve stejnou dobu se však často vytvářejí do kanálů s mnoha objekty, takže možná budeme muset vytvořit řetězec estimátorů, kde EstimatorChain<TLastTransformer> je odhadovač, IEstimator<TTransformer> pro který chceme získat transformátor, zakopán někde v tomto řetězci. Pro tento scénář můžeme prostřednictvím této metody připojit delegáta, který bude volána po zavolání fit. |