Freigeben über


OneHotEncodingEstimator Klasse

Definition

Konvertiert eine oder mehrere Eingabespalten von kategorisierten Werten in so viele Ausgabespalten von Vektoren mit einem hot codierten Vektor.

public sealed class OneHotEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotEncodingTransformer>
type OneHotEncodingEstimator = class
    interface IEstimator<OneHotEncodingTransformer>
Public NotInheritable Class OneHotEncodingEstimator
Implements IEstimator(Of OneHotEncodingTransformer)
Vererbung
OneHotEncodingEstimator
Implementiert

Hinweise

Stimatoreigenschaften

Muss diese Schätzung die Daten untersuchen, um seine Parameter zu trainieren? Yes
Eingabespaltendatentyp Vektor oder Skalar numerischer, boolescher, textDateTime- oder schlüsseltyp.
Ausgabespaltendatentyp Skalar oder Vektor von Schlüssel oder Vektor des Single Typs.
Exportierbar in ONNX Yes

Das OneHotEncodingEstimator Erstellt ein Wörterbuch mit eindeutigen Werten, die in der Eingabespalte angezeigt werden. Das resultierende OneHotEncodingTransformer Konvertiert eine oder mehrere Eingabespalten in so viele Ausgabespalten von Vektoren mit einem hot codierten Vektor.

Dies OneHotEncodingEstimator wird häufig verwendet, um kategorisierte Daten in ein Formular zu konvertieren, das einem maschinellen Lernalgorithmus bereitgestellt werden kann.

Die Ausgabe dieser Transformation wird durch OneHotEncodingEstimator.OutputKind:

  • Indicator erzeugt einen Indikatorvektor. Jeder Slot in diesem Vektor entspricht einer Kategorie im Wörterbuch, sodass seine Länge der Größe des erstellten Wörterbuchs entspricht. Wenn ein Wert im Diktat nicht gefunden wird, ist die Ausgabe der Nullvektor.

  • Bag erzeugt einen Vektor, sodass jeder Slot die Anzahl der Vorkommen des entsprechenden Werts im Eingabevektor speichert. Jeder Platz in diesem Vektor entspricht einem Wert im Wörterbuch, sodass seine Länge die Größe des integrierten Wörterbuchs ist. Indicator und Bag unterscheiden sich einfach darin, wie die von einzelnen Slots in der Eingabespalte generierten Bitvektoren aggregiert werden: Für Indikator werden sie verkettet und für Bag hinzugefügt. Wenn die Quellspalte ein Skalar ist, sind die Optionen "Indikator" und "Bag" identisch.

  • Key erzeugt Schlüssel in einer KeyDataViewType Spalte. Wenn es sich bei der Eingabespalte um einen Vektor handelt, enthält die Ausgabe einen Vektorschlüsseltyp , wobei jedes Vektormodul dem jeweiligen Platz des Eingabevektors entspricht. Wenn eine Kategorie im Bulit-Wörterbuch nicht gefunden wird, wird der Wert Null zugewiesen.

  • Binary erstellt einen binär codierten Vektor, um die Werte im Wörterbuch darzustellen, die in der Eingabespalte vorhanden sind. Wenn ein Wert in der Eingabespalte nicht im Wörterbuch gefunden wird, ist die Ausgabe der Nullvektor.

Die OneHotEncodingTransformer kann auf eine oder mehrere Spalten angewendet werden, in diesem Fall erstellt und verwendet ein separates Wörterbuch für jede Spalte, auf die sie angewendet wird.

Überprüfen Sie den Abschnitt "Siehe auch", um Links zu Verwendungsbeispielen zu finden.

Methoden

Fit(IDataView)

Züge und zurückgeben eine OneHotEncodingTransformer.

GetOutputSchema(SchemaShape)

Gibt das SchemaShape Schema zurück, das vom Transformator erzeugt wird. Wird für die Schemavermehrung und Überprüfung in einer Pipeline verwendet.

Erweiterungsmethoden

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Fügen Sie einen "Zwischenspeicherpunkt" an die Stimatorkette an. Dadurch wird sichergestellt, dass die nachgelagerten Stimatoren gegen zwischengespeicherte Daten trainiert werden. Es ist hilfreich, einen Cache-Prüfpunkt zu haben, bevor Trainer, die mehrere Daten übergeben.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Geben Sie aufgrund einer Schätzung ein Umbruchobjekt zurück, das einen Stellvertretung aufruft, sobald Fit(IDataView) er aufgerufen wird. Es ist oft wichtig, dass eine Schätzung Informationen zu dem zurückgibt, was passt, weshalb die Fit(IDataView) Methode ein spezifisches typiertes Objekt zurückgibt, anstatt nur ein allgemeines ITransformer. Gleichzeitig IEstimator<TTransformer> werden jedoch oft Pipelines mit vielen Objekten gebildet, sodass wir möglicherweise eine Kette von EstimatorChain<TLastTransformer> Schätzern erstellen müssen, über die der Schätzer, für den wir den Transformator erhalten möchten, irgendwo in dieser Kette begraben wird. Für dieses Szenario können wir über diese Methode eine Stellvertretung anfügen, die einmal aufgerufen wird, wenn die Anpassung aufgerufen wird.

Gilt für:

Weitere Informationen