Belang van permutatiefunctie
Belangrijk
De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.
Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.
- Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
- Meer informatie over Azure Machine Learning.
De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.
Berekent de belangsscores van de permutatiefunctie van functievariabelen op basis van een getraind model en een test-gegevensset
Categorie: Functieselectiemodules
Notitie
Van toepassing op: Machine Learning Studio (klassiek)
Vergelijkbare modules met slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.
Moduleoverzicht
In dit artikel wordt beschreven hoe u de module Belang van permutatiefunctie in Machine Learning Studio (klassiek) gebruikt om een set score voor functie-belang voor uw gegevensset te berekenen. U gebruikt deze scores om u te helpen bepalen welke functies het beste in een model moeten worden gebruikt.
In deze module worden functiewaarden willekeurig in willekeurige volgorde geplaatst, één kolom tegelijk en worden de prestaties van het model vóór en na gemeten. U kunt een van de standaard metrische gegevens kiezen om de prestaties te meten.
De scores die de module retourneert, vertegenwoordigen de wijziging in de prestaties van een getraind model, na permutatie. Belangrijke functies zijn doorgaans gevoeliger voor het shuffling-proces en leiden dus tot scores met een hoger belang.
Dit artikel biedt een goed algemeen overzicht van het belang van permutatiefunctie, de theoretische basis en de toepassingen ervan in machine learning: Belang van permutatiefunctie
Belang van permutatiefunctie gebruiken
Als u een set functiescores wilt genereren, moet u een al getraind model en een testset hebben.
Voeg de module Belang van permutatiefunctie toe aan uw experiment. U vindt deze module in de categorie Functieselectie .
Verbinding maken getraind model aan de linkerkant. Het model moet een regressiemodel of classificatiemodel zijn.
Koppel aan de rechterinvoer een gegevensset, bij voorkeur een gegevensset die verschilt van de gegevensset die wordt gebruikt voor het trainen van het model. Deze gegevensset wordt gebruikt om te scoren op basis van het getrainde model en om het model te evalueren nadat de functiewaarden zijn gewijzigd.
Voor Willekeurige seed typt u een waarde die moet worden gebruikt als seed voor randomisatie. Als u 0 opgeeft (de standaardinstelling), wordt er een getal gegenereerd op basis van de systeemklok.
Een seed-waarde is optioneel, maar u moet een waarde geven als u reproduceerbaarheid wilt tussen de runs van hetzelfde experiment.
Voor Metrische gegevens voor het meten van prestaties selecteert u één metrische gegevens die moeten worden gebruikt bij het berekenen van de kwaliteit van het model na permutatie.
Machine Learning Studio (klassiek) ondersteunt de volgende metrische gegevens, afhankelijk van of u een classificatie- of regressiemodel evalueert:
Classificatie
Nauwkeurigheid, precisie, terughalen, gemiddeld logboekverlies
Regressie
Precision, Recall, Mean Absolute Error , Root Mean Squared Error, Relative Absolute Error, Relative Squared Error, Coefficient of Determination
Zie Evalueren voor een gedetailleerde beschrijving van deze metrische evaluatiegegevens en hoe deze worden berekend.
Voer het experiment uit.
De module geeft een lijst met functiekolommen en de bijbehorende scores weer, gerangschikt op volgorde van de scores, aflopend.
Voorbeelden
Bekijk deze voorbeeldexperimenten in de Azure AI Gallery:
Belang van permutatiefunctie: demonstreert hoe u deze module gebruikt om functievariabelen van een gegevensset te rangschikken op volgorde van scores voor permutatie-belang.
De module Belang van permutatiefunctie gebruiken: illustreert het gebruik van deze module in een webservice.
Technische opmerkingen
Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.
Hoe verhoudt dit zich tot andere methoden voor het selecteren van functies?
Het belang van permutatiefunctie werkt door de waarden van elke functiekolom, één kolom tegelijk, willekeurig te wijzigen en vervolgens het model te evalueren.
De classificaties die worden geboden door het belang van de permutatiefunctie verschillen vaak van de classificaties die u krijgt van Filter Based Feature Selection, waarmee scores worden berekend voordat een model wordt gemaakt.
Dit komt doordat het belang van permutatiefunctie niet de associatie meet tussen een functie en een doelwaarde, maar in plaats daarvan vast legt hoeveel invloed elke functie heeft op voorspellingen van het model.
Verwachte invoer
Naam | Type | Description |
---|---|---|
Getraind model | ILearner-interface | Een getraind classificatie- of regressiemodel |
Testgegevens | Gegevenstabel | Test de gegevensset voor het scoren en evalueren van een model na het permuteren van functiewaarden |
Moduleparameters
Naam | Type | Bereik | Optioneel | Standaard | Beschrijving |
---|---|---|---|---|---|
Willekeurige seed | Geheel getal | >= 0 | Vereist | 0 | Seed-waarde van generator voor willekeurige getallen |
Metrische gegevens voor het meten van prestaties | EvaluationMetricType | selecteren in de lijst | Vereist | Classificatie - nauwkeurigheid | Selecteer de metrische gegevens die moeten worden gebruikt bij het evalueren van de variabiliteit van het model na permutaties |
Uitvoerwaarden
Naam | Type | Description |
---|---|---|
Functie-urgentie | Gegevenstabel | Een gegevensset met de resultaten van het belang van de functie, op basis van de geselecteerde metrische waarde |
Uitzonderingen
Uitzondering | Description |
---|---|
Fout 0062 | Er treedt een uitzondering op bij het vergelijken van twee modellen met verschillende typen studenten. |
Fout 0024 | Uitzondering treedt op als de gegevensset geen labelkolom bevat. |
Fout 0105 | Wordt opgeslagen wanneer een moduledefinitiebestand een parametertype definieert dat niet is gesuporteerd |
Fout 0021 | Uitzondering treedt op als het aantal rijen in sommige gegevenssets dat aan de module wordt doorgegeven te klein is. |
Zie ook
Functieselectie
Functieselectie op basis van filters
Analyse van hoofdcomponenten