Välj parametrar för att optimera dina algoritmer i Machine Learning Studio (klassisk)

Artikel
11/29/2017

GÄLLER FÖR: Gäller för. Machine Learning Studio (klassisk) Gäller inte för. Azure Machine Learning

Viktigt!

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Det här avsnittet beskriver hur du väljer rätt hyperparameteruppsättning för en algoritm i Machine Learning Studio (klassisk). De flesta maskininlärningsalgoritmer har parametrar att ange. När du tränar en modell måste du ange värden för dessa parametrar. Effekten av den tränade modellen beror på de modellparametrar som du väljer. Processen att hitta den optimala uppsättningen parametrar kallas för modellval.

Det finns olika sätt att välja modell. Inom maskininlärning är korsvalidering en av de mest använda metoderna för modellval, och det är standardmekanismen för modellval i Machine Learning Studio (klassisk). Eftersom Machine Learning Studio (klassisk) stöder både R och Python kan du alltid implementera egna modellvalsmekanismer med hjälp av antingen R eller Python.

Det finns fyra steg i processen för att hitta den bästa parameteruppsättningen:

Definiera parameterutrymmet: För algoritmen ska du först bestämma de exakta parametervärden som du vill överväga.
Definiera inställningarna för korsvalidering: Bestäm hur du väljer korsvalideringsdelegeringar för datauppsättningen.
Definiera måttet: Bestäm vilket mått som ska användas för att fastställa den bästa uppsättningen parametrar, till exempel noggrannhet, rot mean squared error, precision, recall eller f-score.
Träna, utvärdera och jämför: För varje unik kombination av parametervärdena utförs korsvalidering av och baseras på det felmått som du definierar. Efter utvärdering och jämförelse kan du välja den modell som fungerar bäst.

Följande bild visar hur detta kan uppnås i Machine Learning Studio (klassisk).

Hitta den bästa parameteruppsättningen

Definiera parameterutrymmet

Du kan definiera parameteruppsättningen i modellinitieringssteget. Parameterfönstret för alla maskininlärningsalgoritmer har två träningslägen: Enkel parameter och parameterintervall. Välj Parameterintervallläge. I läge för parameterintervall kan du ange flera värden för varje parameter. Du kan ange kommaavgränsade värden i textrutan.

Tvåklasssförstärkning av beslutsträd, enskild parameter

Alternativt kan du definiera rutnätets högsta och lägsta punkter och det totala antalet punkter som ska genereras med Use Range Builder. Som standard genereras parametervärdena i linjär skala. Men om loggskalan är markerad genereras värdena i loggskalan (det vill sägs att förhållandet mellan intilliggande punkter är konstant i stället för deras skillnad). För heltalsparametrar kan du definiera ett intervall med hjälp av ett bindestreck. Till exempel innebär "1–10" att alla heltal mellan 1 och 10 (båda inklusive) utgör parameteruppsättningen. Ett blandat läge stöds också. Parameteruppsättningen "1–10, 20, 50" skulle till exempel innehålla heltalen 1–10, 20 och 50.

Tvåklasssförstärkning av beslutsträd, parameterintervall

Definiera korsvalideringsdelegeringar

Modulen Partition och Exempel kan användas för att slumpmässigt tilldela vikningar till data. I följande exempelkonfiguration för modulen definierar vi fem veck och tilldelar slumpmässigt ett viknummer till exempelinstanserna.

Partition och exempel

Definiera måttet

Modulen Tune Model Hyperparameters ger stöd för att empiriskt välja den bästa uppsättningen parametrar för en viss algoritm och datauppsättning. Förutom annan information om hur du tränar modellen innehåller fönstret Egenskaper i den här modulen måttet för att fastställa den bästa parameteruppsättningen. Den har två olika listrutor för klassificerings- respektive regressionsalgoritmer. Om den algoritm som övervägs är en klassificeringsalgoritm ignoreras regressionsmåttet och vice versa. I det här specifika exemplet är måttet Noggrannhet.

Svepparametrar

Träna, utvärdera och jämföra

Samma Tune Model Hyperparameters-modul tränar alla modeller som motsvarar parameteruppsättningen, utvärderar olika mått och skapar sedan den bäst tränade modellen baserat på det mått du väljer. Den här modulen har två obligatoriska indata:

Den otränade eleven
Datamängden

Modulen har också valfria indata för datamängden. Anslut datauppsättningen med vikinformation till obligatoriska datauppsättningsindata. Om datauppsättningen inte tilldelas någon vikbar information körs en 10-faldig korsvalidering automatiskt som standard. Om viktilldelningen inte är klar och en valideringsdatauppsättning tillhandahålls på den valfria datauppsättningsporten väljs ett träningstestläge och den första datamängden används för att träna modellen för varje parameterkombination.

Förbättrad beslutsträdsklassificerare

Modellen utvärderas sedan på valideringsdatauppsättningen. Den vänstra utdataporten i modulen visar olika mått som funktioner för parametervärden. Rätt utdataport ger den tränade modellen som motsvarar den bäst presterande modellen enligt det valda måttet (Noggrannhet i det här fallet).

Datauppsättning för validering

Du kan se de exakta parametrar som väljs genom att visualisera rätt utdataport. Den här modellen kan användas för att bedöma en testuppsättning eller i en operationaliserad webbtjänst efter att ha sparats som en tränad modell.

Dela via

Välj parametrar för att optimera dina algoritmer i Machine Learning Studio (klassisk)

Definiera parameterutrymmet

Definiera korsvalideringsdelegeringar

Definiera måttet

Träna, utvärdera och jämföra

Ytterligare resurser