MutualInformationFeatureSelectingEstimator Klasa
Definicja
Ważne
Niektóre informacje odnoszą się do produktu w wersji wstępnej, który może zostać znacząco zmodyfikowany przed wydaniem. Firma Microsoft nie udziela żadnych gwarancji, jawnych lub domniemanych, w odniesieniu do informacji podanych w tym miejscu.
Wybiera górne gniazda k we wszystkich określonych kolumnach uporządkowanych przez ich wzajemne informacje z kolumną etykiety (co można dowiedzieć się o etykiecie, obserwując wartość określonej kolumny).
public sealed class MutualInformationFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type MutualInformationFeatureSelectingEstimator = class
interface IEstimator<ITransformer>
Public NotInheritable Class MutualInformationFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
- Dziedziczenie
-
MutualInformationFeatureSelectingEstimator
- Implementuje
Uwagi
Charakterystyka narzędzia do szacowania
Czy ten narzędzie do szacowania musi przyjrzeć się danym, aby wytrenować jego parametry? | Tak |
Typ danych kolumny wejściowej | Wektor lub skalarny typów danych liczbowych, tekstowych lub kluczowych |
Typ danych kolumny wyjściowej | Tak samo jak kolumna wejściowa |
Eksportowanie do pliku ONNX | Tak |
Formalnie wzajemne informacje mogą być napisane jako:
$\text{MI}(X,Y) = E_{x,y}[\log(P(x,y)) - \log(P(x)) - \log(P(y))]$, gdzie $x$ i $y$ to obserwacje zmiennych losowych $X$ i $Y$.
w przypadku gdy oczekiwanie E jest przejmowane przez wspólną dystrybucję X i Y. Tutaj P(x, y) jest wspólną funkcją gęstości prawdopodobieństwa X i Y, P(x) i P(y) są marginalne funkcje gęstości prawdopodobieństwa odpowiednio X i Y. Ogólnie rzecz biorąc, wyższa wzajemne informacje między zmienną zależną (lub etykietą) i niezależną zmienną (lub funkcją) oznacza, że etykieta ma wyższą wzajemne zależności od tej funkcji. Utrzymuje on najważniejsze miejsca w funkcjach wyjściowych z największymi wzajemnymi informacjami o etykiecie.
Na przykład w przypadku poniższej kolumny Funkcje i etykieta, jeśli określimy, że chcemy, aby 2 pierwsze miejsca (elementy wektorowe), które mają wyższą korelację z kolumną etykiety, dane wyjściowe zastosowania tego narzędzia do szacowania zachowałyby tylko pierwsze i trzecie miejsca, ponieważ ich wartości są bardziej skorelowane z wartościami w kolumnie Etykieta.
Etykieta | Funkcje |
---|---|
Prawda | 4,6,0 |
Fałsz | 0,7,5 |
Prawda | 4,7,0 |
Fałsz | 0,7,0 |
W ten sposób powyższy zestaw danych będzie wyglądał, po dopasowaniu narzędzia do szacowania i przekształceniu danych za pomocą wynikowego transformatora:
Etykieta | Funkcje |
---|---|
Prawda | 4,0 |
Fałsz | 0,5 |
Prawda | 4,0 |
Fałsz | 0,0 |
Zapoznaj się z sekcją Zobacz również, aby uzyskać linki do przykładów użycia.
Metody
Fit(IDataView) |
Trenuje i zwraca wartość ITransformer. |
GetOutputSchema(SchemaShape) |
SchemaShape Zwraca schemat, który zostanie wygenerowany przez transformator. Służy do propagacji schematu i weryfikacji w potoku. |
Metody rozszerzania
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Dołącz punkt kontrolny buforowania do łańcucha narzędzia do szacowania. Zapewni to, że narzędzia do szacowania podrzędnego zostaną wytrenowane względem buforowanych danych. Warto mieć punkt kontrolny buforowania, zanim trenerzy przejmą wiele danych. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Biorąc pod uwagę narzędzie do szacowania, zwróć obiekt opakowujący, który wywoła delegata po Fit(IDataView) wywołaniu. Często ważne jest, aby narzędzie do szacowania zwracało informacje o tym, co było odpowiednie, dlatego Fit(IDataView) metoda zwraca specjalnie wpisany obiekt, a nie tylko ogólną ITransformerwartość . Jednak w tym samym czasie IEstimator<TTransformer> często są tworzone w potoki z wieloma obiektami, więc może być konieczne utworzenie łańcucha narzędzi do szacowania za pośrednictwem EstimatorChain<TLastTransformer> miejsca, w którym narzędzie do szacowania, dla którego chcemy uzyskać transformator jest pochowany gdzieś w tym łańcuchu. W tym scenariuszu możemy za pomocą tej metody dołączyć delegata, który zostanie wywołany po wywołaniu dopasowania. |