Permutationfunktionsprioritet
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
Beräknar permutationsfunktionspoängen för funktionsvariabler givet en tränad modell och en testdatamängd
Kategori: Funktionsvalsmoduler
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Modulöversikt
I den här artikeln beskrivs hur du använder modulen Funktions prioritet permutation i Machine Learning Studio (klassisk) för att beräkna en uppsättning funktionspoäng för din datauppsättning. Du använder dessa poäng för att avgöra vilka funktioner som är bäst att använda i en modell.
I den här modulen blandas funktionsvärden slumpmässigt, en kolumn i taget och modellens prestanda mäts före och efter. Du kan välja något av de standardmått som tillhandahålls för att mäta prestanda.
Poängen som modulen returnerar representerar förändringen i prestanda för en tränad modell efter permutation. Viktiga funktioner är vanligtvis mer känsliga för blandningsprocessen och leder därför till högre prioritetspoäng.
Den här artikeln ger en bra allmän översikt över permutationsfunktions vikt, dess teoretiska grund och dess program inom maskininlärning: Permutationsfunktions vikt
Så här använder du permutationsfunktions prioritet
För att generera en uppsättning funktionspoäng måste du ha en redan tränad modell, samt en testdatamängd.
Lägg till modulen Permutation Feature Importance (Funktionsprivile prioritet för permutation) i experimentet. Du hittar den här modulen i kategorin Funktionsval .
Anslut en tränad modell till vänster indata. Modellen måste vara en regressionsmodell eller en klassificeringsmodell.
Till höger indata ansluter du en datauppsättning, helst en som skiljer sig från den datamängd som används för att träna modellen. Den här datamängden används för bedömning baserat på den tränade modellen och för att utvärdera modellen när funktionsvärdena har ändrats.
För Slumpmässigt startvärde anger du ett värde som ska användas som startvärde för randomisering. Om du anger 0 (standard) genereras ett tal baserat på systemklockan.
Ett startvärde är valfritt, men du bör ange ett värde om du vill reproducerbarhet mellan körningar av samma experiment.
För Mått för att mäta prestanda väljer du ett enda mått som ska användas vid beräkning av modellkvalitet efter permutation.
Machine Learning Studio (klassisk) stöder följande mått, beroende på om du utvärderar en klassificerings- eller regressionsmodell:
Klassificering
Precision, precision, träffsäkerhet, genomsnittlig loggförlust
Regression
Precision, träffsäkerhet, absolut medelfel, medelk squared-fel, relativt absolutfel, relativt kvadratfel, bestämningskoefficient
En mer detaljerad beskrivning av de här utvärderingsmåtten och hur de beräknas finns i Utvärdera.
Kör experimentet.
Modulen matar ut en lista över funktionskolumner och poängen som är associerade med dem, rangordnade efter poängen, fallande.
Exempel
Se följande exempelexperiment i Azure AI Gallery:
Permutationsfunktions prioritet: Visar hur du använder den här modulen för att rangordna funktionsvariabler för en datauppsättning i ordning efter prioritetspoäng för permutation.
Använda modulen Permutation Feature Importance (Permutationsfunktions prioritet): Visar användningen av den här modulen i en webbtjänst.
Teknisk information
Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.
Hur är detta jämfört med andra metoder för funktionsval?
Permutationsfunktionens prioritet fungerar genom att slumpmässigt ändra värdena för varje egenskapskolumn, en kolumn i taget och sedan utvärdera modellen.
Rangordningarna som tillhandahålls av permutationsfunktions prioritet skiljer sig ofta från de som du får från Val av filterbaserad funktion, som beräknar poäng innan en modell skapas.
Det beror på att permutationsfunktionens prioritet inte mäter associationen mellan en funktion och ett målvärde, utan i stället fångar hur mycket påverkan varje funktion har på förutsägelser från modellen.
Förväntade indata
Namn | Typ | Description |
---|---|---|
Tränad modell | ILearner-gränssnitt | En tränad klassificerings- eller regressionsmodell |
Testdata | Datatabell | Testa datauppsättningen för bedömning och utvärdering av en modell efter permutation av funktionsvärden |
Modulparametrar
Namn | Typ | Intervall | Valfritt | Standardvärde | Description |
---|---|---|---|---|---|
Slumpmässigt start seed | Integer | >= 0 | Obligatorisk | 0 | Slumptalsgeneratorvärde |
Mått för att mäta prestanda | EvaluationMetricType | välj från listan | Obligatorisk | Klassificering – noggrannhet | Välj det mått som ska användas vid utvärdering av variabiliteten för modellen efter permutationer |
Utdata
Namn | Typ | Description |
---|---|---|
Egenskapsprioritet | Datatabell | En datauppsättning som innehåller resultat av funktions prioritet baserat på det valda måttet |
Undantag
Undantag | Description |
---|---|
Fel 0062 | Undantag inträffar när du försöker jämföra två modeller med olika typer av elever. |
Fel 0024 | Undantaget inträffar om datauppsättningen inte innehåller en etikettkolumn. |
Fel 0105 | Visas när en moduldefinitionsfil definierar en ouppporterad parametertyp |
Fel 0021 | Undantaget inträffar om antalet rader i vissa datauppsättningar som skickas till modulen är för litet. |
Se även
Val av funktion
Filterbaserat funktionsval
Analys av huvudkomponent