WordEmbeddingEstimator Klasa
Definicja
Ważne
Niektóre informacje odnoszą się do produktu w wersji wstępnej, który może zostać znacząco zmodyfikowany przed wydaniem. Firma Microsoft nie udziela żadnych gwarancji, jawnych lub domniemanych, w odniesieniu do informacji podanych w tym miejscu.
Cecha tekstowa, która konwertuje wektory tokenów tekstowych na wektor liczbowy przy użyciu wstępnie wytrenowanego modelu osadzania.
public sealed class WordEmbeddingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.WordEmbeddingTransformer>
type WordEmbeddingEstimator = class
interface IEstimator<WordEmbeddingTransformer>
Public NotInheritable Class WordEmbeddingEstimator
Implements IEstimator(Of WordEmbeddingTransformer)
- Dziedziczenie
-
WordEmbeddingEstimator
- Implementuje
Uwagi
Charakterystyka narzędzia do szacowania
Czy ten narzędzie do szacowania musi przyjrzeć się danym, aby wytrenować jego parametry? | Nie |
Typ danych kolumny wejściowej | Wektor tekstu |
Typ danych kolumny wyjściowej | Znany wektor wielkości Single |
Możliwość eksportowania do ONNX | Nie |
Tworzy WordEmbeddingTransformer nową kolumnę o nazwie określonej w parametrach nazwy kolumny wyjściowej, gdzie każdy wektor wejściowy jest mapowany na wektor liczbowy o rozmiarze 3 * wymiarowości używanego modelu osadzania. Zwróć uwagę, że jest to niezależne od rozmiaru wektora wejściowego.
Na przykład w przypadku korzystania z funkcji GloVe50D, która sama jest 50-wymiarowa, kolumna wyjściowa jest wektorem o rozmiarze 150. Pierwsza trzecia miejsc zawiera minimalne wartości we wszystkich osadzach odpowiadających każdemu ciągowi w wektorze wejściowym. Druga trzecia zawiera średnią osadzeń. Ostatnia trzecia miejsc zawiera maksymalne wartości napotkanych osadzeń. Wartość minimalna/maksymalna zapewnia hiperkąt ograniczenia wyrazów w obszarze osadzania wyrazów. Może to pomóc w dłuższych frazach, w których średnia wielu słów zagłusza przydatny sygnał.
Użytkownik może określić niestandardowy wstępnie wytrenowany model osadzania lub jeden z dostępnych wstępnie wytrenowanych modeli. Dostępne opcje to różne wersje modeli GloVe, FastText i SSWE.
Zapoznaj się z sekcją Zobacz również, aby uzyskać linki do przykładów użycia.
Metody
Fit(IDataView) |
Trenuje i zwraca wartość WordEmbeddingTransformer. |
GetOutputSchema(SchemaShape) |
SchemaShape Zwraca schemat, który zostanie wygenerowany przez transformator. Służy do propagacji schematu i weryfikacji w potoku. |
Metody rozszerzania
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Dołącz "punkt kontrolny buforowania" do łańcucha narzędzia do szacowania. Zapewni to, że narzędzia do szacowania podrzędnego zostaną wytrenowane pod kątem buforowanych danych. Warto mieć punkt kontrolny buforowania, zanim trenerzy przejdą wiele danych. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Biorąc pod uwagę narzędzie do szacowania, zwróć obiekt opakowujący, który będzie wywoływać delegata po Fit(IDataView) wywołaniu. Często ważne jest, aby narzędzie do szacowania zwracało informacje o tym, co było odpowiednie, dlatego Fit(IDataView) metoda zwraca specjalnie wpisany obiekt, a nie tylko ogólny ITransformerelement . Jednak w tym samym czasie IEstimator<TTransformer> są często tworzone w potoki z wieloma obiektami, więc może być konieczne utworzenie łańcucha narzędzi do szacowania, za pośrednictwem EstimatorChain<TLastTransformer> którego narzędzie do szacowania, dla którego chcemy uzyskać transformator jest pochowany gdzieś w tym łańcuchu. W tym scenariuszu możemy za pomocą tej metody dołączyć delegata, który zostanie wywołany po wywołaniu dopasowania. |