OneHotEncodingEstimator Klasa
Definicja
Ważne
Niektóre informacje odnoszą się do produktu w wersji wstępnej, który może zostać znacząco zmodyfikowany przed wydaniem. Firma Microsoft nie udziela żadnych gwarancji, jawnych lub domniemanych, w odniesieniu do informacji podanych w tym miejscu.
Konwertuje co najmniej jedną kolumnę wejściową wartości kategorii na dowolną liczbę kolumn wyjściowych wektorów zakodowanych na gorąco.
public sealed class OneHotEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotEncodingTransformer>
type OneHotEncodingEstimator = class
interface IEstimator<OneHotEncodingTransformer>
Public NotInheritable Class OneHotEncodingEstimator
Implements IEstimator(Of OneHotEncodingTransformer)
- Dziedziczenie
-
OneHotEncodingEstimator
- Implementuje
Uwagi
Charakterystyka narzędzia do szacowania
Czy ten narzędzie do szacowania musi przyjrzeć się danym, aby wytrenować jego parametry? | Tak |
Typ danych kolumny wejściowej | Wektor lub skalarny typu liczbowego, logicznego, DateTimetekstowego lub klucza. |
Typ danych kolumny wyjściowej | Skalarny lub wektor klucza lub wektor typu Single . |
Eksportowanie do pliku ONNX | Tak |
Element OneHotEncodingEstimator tworzy słownik unikatowych wartości wyświetlanych w kolumnie wejściowej. OneHotEncodingTransformer Wynikowa formuła konwertuje co najmniej jedną kolumnę wejściową na dowolną liczbę kolumn wyjściowych wektorów zakodowanych na gorąco.
Często OneHotEncodingEstimator służy do konwertowania danych kategorii na formularz, który może być udostępniany algorytmowi uczenia maszynowego.
Dane wyjściowe tej transformacji są określane przez element OneHotEncodingEstimator.OutputKind:
Indicator generuje wektor wskaźnika. Każde miejsce w tym wektorze odpowiada kategorii w słowniku, więc jego długość jest rozmiarem utworzonego słownika. Jeśli wartość nie zostanie znaleziona w dictioray, dane wyjściowe są wektorem zerowym.
Bag tworzy jeden wektor, tak aby każde miejsce przechowywało liczbę wystąpień odpowiedniej wartości w wektorze wejściowym. Każde miejsce w tym wektorze odpowiada wartości w słowniku, więc jego długość jest rozmiarem utworzonego słownika. Indicator i Bag różnią się po prostu sposobem, w jaki wektory bitowe generowane z poszczególnych miejsc w kolumnie wejściowej są agregowane: dla wskaźnika są one łączone i dla torby są dodawane. Gdy kolumna źródłowa jest skalarną, opcje Wskaźnik i Torba są identyczne.
Key tworzy klucze w kolumnie KeyDataViewType . Jeśli kolumna wejściowa jest wektorem, dane wyjściowe zawierają typ klucza wektorowego, gdzie każde miejsce wektora odpowiada odpowiedniemu gniazda wektora wejściowego. Jeśli kategoria nie zostanie znaleziona w słowniku bulit, zostanie przypisana wartość zero.
Binary tworzy wektor zakodowany binarnie reprezentujący wartości znalezione w słowniku, które znajdują się w kolumnie wejściowej. Jeśli wartość w kolumnie wejściowej nie zostanie znaleziona w słowniku, dane wyjściowe są wektorem zerowym.
Element OneHotEncodingTransformer można zastosować do co najmniej jednej kolumny, w takim przypadku kompiluje i używa oddzielnego słownika dla każdej kolumny, do której jest stosowany.
Zapoznaj się z sekcją Zobacz również, aby uzyskać linki do przykładów użycia.
Metody
Fit(IDataView) |
Trenuje i zwraca wartość OneHotEncodingTransformer. |
GetOutputSchema(SchemaShape) |
SchemaShape Zwraca schemat, który zostanie wygenerowany przez transformator. Służy do propagacji schematu i weryfikacji w potoku. |
Metody rozszerzania
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Dołącz punkt kontrolny buforowania do łańcucha narzędzia do szacowania. Zapewni to, że narzędzia do szacowania podrzędnego zostaną wytrenowane względem buforowanych danych. Warto mieć punkt kontrolny buforowania, zanim trenerzy przejmą wiele danych. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Biorąc pod uwagę narzędzie do szacowania, zwróć obiekt opakowujący, który wywoła delegata po Fit(IDataView) wywołaniu. Często ważne jest, aby narzędzie do szacowania zwracało informacje o tym, co było odpowiednie, dlatego Fit(IDataView) metoda zwraca specjalnie wpisany obiekt, a nie tylko ogólną ITransformerwartość . Jednak w tym samym czasie IEstimator<TTransformer> często są tworzone w potoki z wieloma obiektami, więc może być konieczne utworzenie łańcucha narzędzi do szacowania za pośrednictwem EstimatorChain<TLastTransformer> miejsca, w którym narzędzie do szacowania, dla którego chcemy uzyskać transformator jest pochowany gdzieś w tym łańcuchu. W tym scenariuszu możemy za pomocą tej metody dołączyć delegata, który zostanie wywołany po wywołaniu dopasowania. |
Dotyczy
Zobacz też
- OneHotEncoding(TransformsCatalog+CategoricalTransforms, String, String, OneHotEncodingEstimator+OutputKind, Int32, ValueToKeyMappingEstimator+KeyOrdinality, IDataView)
- OneHotEncoding(TransformsCatalog+CategoricalTransforms, InputOutputColumnPair[], OneHotEncodingEstimator+OutputKind, Int32, ValueToKeyMappingEstimator+KeyOrdinality, IDataView)