Udostępnij za pośrednictwem


OneHotEncodingEstimator Klasa

Definicja

Konwertuje co najmniej jedną kolumnę wejściową wartości kategorii na dowolną liczbę kolumn wyjściowych wektorów zakodowanych na gorąco.

public sealed class OneHotEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotEncodingTransformer>
type OneHotEncodingEstimator = class
    interface IEstimator<OneHotEncodingTransformer>
Public NotInheritable Class OneHotEncodingEstimator
Implements IEstimator(Of OneHotEncodingTransformer)
Dziedziczenie
OneHotEncodingEstimator
Implementuje

Uwagi

Charakterystyka narzędzia do szacowania

Czy ten narzędzie do szacowania musi przyjrzeć się danym, aby wytrenować jego parametry? Tak
Typ danych kolumny wejściowej Wektor lub skalarny typu liczbowego, logicznego, DateTimetekstowego lub klucza.
Typ danych kolumny wyjściowej Skalarny lub wektor klucza lub wektor typu Single .
Eksportowanie do pliku ONNX Tak

Element OneHotEncodingEstimator tworzy słownik unikatowych wartości wyświetlanych w kolumnie wejściowej. OneHotEncodingTransformer Wynikowa formuła konwertuje co najmniej jedną kolumnę wejściową na dowolną liczbę kolumn wyjściowych wektorów zakodowanych na gorąco.

Często OneHotEncodingEstimator służy do konwertowania danych kategorii na formularz, który może być udostępniany algorytmowi uczenia maszynowego.

Dane wyjściowe tej transformacji są określane przez element OneHotEncodingEstimator.OutputKind:

  • Indicator generuje wektor wskaźnika. Każde miejsce w tym wektorze odpowiada kategorii w słowniku, więc jego długość jest rozmiarem utworzonego słownika. Jeśli wartość nie zostanie znaleziona w dictioray, dane wyjściowe są wektorem zerowym.

  • Bag tworzy jeden wektor, tak aby każde miejsce przechowywało liczbę wystąpień odpowiedniej wartości w wektorze wejściowym. Każde miejsce w tym wektorze odpowiada wartości w słowniku, więc jego długość jest rozmiarem utworzonego słownika. Indicator i Bag różnią się po prostu sposobem, w jaki wektory bitowe generowane z poszczególnych miejsc w kolumnie wejściowej są agregowane: dla wskaźnika są one łączone i dla torby są dodawane. Gdy kolumna źródłowa jest skalarną, opcje Wskaźnik i Torba są identyczne.

  • Key tworzy klucze w kolumnie KeyDataViewType . Jeśli kolumna wejściowa jest wektorem, dane wyjściowe zawierają typ klucza wektorowego, gdzie każde miejsce wektora odpowiada odpowiedniemu gniazda wektora wejściowego. Jeśli kategoria nie zostanie znaleziona w słowniku bulit, zostanie przypisana wartość zero.

  • Binary tworzy wektor zakodowany binarnie reprezentujący wartości znalezione w słowniku, które znajdują się w kolumnie wejściowej. Jeśli wartość w kolumnie wejściowej nie zostanie znaleziona w słowniku, dane wyjściowe są wektorem zerowym.

Element OneHotEncodingTransformer można zastosować do co najmniej jednej kolumny, w takim przypadku kompiluje i używa oddzielnego słownika dla każdej kolumny, do której jest stosowany.

Zapoznaj się z sekcją Zobacz również, aby uzyskać linki do przykładów użycia.

Metody

Fit(IDataView)

Trenuje i zwraca wartość OneHotEncodingTransformer.

GetOutputSchema(SchemaShape)

SchemaShape Zwraca schemat, który zostanie wygenerowany przez transformator. Służy do propagacji schematu i weryfikacji w potoku.

Metody rozszerzania

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Dołącz punkt kontrolny buforowania do łańcucha narzędzia do szacowania. Zapewni to, że narzędzia do szacowania podrzędnego zostaną wytrenowane względem buforowanych danych. Warto mieć punkt kontrolny buforowania, zanim trenerzy przejmą wiele danych.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Biorąc pod uwagę narzędzie do szacowania, zwróć obiekt opakowujący, który wywoła delegata po Fit(IDataView) wywołaniu. Często ważne jest, aby narzędzie do szacowania zwracało informacje o tym, co było odpowiednie, dlatego Fit(IDataView) metoda zwraca specjalnie wpisany obiekt, a nie tylko ogólną ITransformerwartość . Jednak w tym samym czasie IEstimator<TTransformer> często są tworzone w potoki z wieloma obiektami, więc może być konieczne utworzenie łańcucha narzędzi do szacowania za pośrednictwem EstimatorChain<TLastTransformer> miejsca, w którym narzędzie do szacowania, dla którego chcemy uzyskać transformator jest pochowany gdzieś w tym łańcuchu. W tym scenariuszu możemy za pomocą tej metody dołączyć delegata, który zostanie wywołany po wywołaniu dopasowania.

Dotyczy

Zobacz też