Statistiska funktioner
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
I den här artikeln beskrivs de moduler i Machine Learning Studio (klassisk) som stöder matematiska och statistiska åtgärder som är kritiska för maskininlärning. Om du behöver utföra uppgifter som följande i experimentet kan du titta i kategorin Statistiska funktioner:
- Utföra ad hoc-beräkningar på kolumnvärden, till exempel avrundning eller med ett absolut värde.
- Beräkning innebär, logaritmer och annan statistik som ofta används inom maskininlärning.
- Beräkna korrelations- och sannolikhetspoäng.
- Beräkna z-poäng.
- Beräkna statistiska fördelningar som används ofta, till exempel Weibull, linux och beta.
- Generera statistiska rapporter över en uppsättning kolumner eller en datauppsättning.
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Om du till exempel har en ny datauppsättning kan du använda modulen Sammanfatta data först. Den genererar en rapport för en hel datamängd som innehåller statistiska standardmått, till exempel medelvärde och standardavvikelse.
Om du behöver mer avancerad statistik, till exempel snedhet i urvalet eller ett interquartilavstånd, kan du använda modulen Beräkna elementär statistik för att generera ytterligare beskrivande statistik.
Eftersom modulerna genererar resultaten varje gång du kör experimentet uppdateras resultatet om dina data ändras.
Lista över moduler
Kategorin Statistikfunktioner innehåller följande moduler:
- Tillämpa matematisk åtgärd: Tillämpar en matematisk åtgärd på kolumnvärden.
- Beräkna elementär statistik: Beräknar angiven sammanfattningsstatistik för valda datamängdskolumner.
- Beräkna linjär korrelation: Beräknar den linjära korrelationen mellan kolumnvärden i en datauppsättning.
- Funktionen Evaluate Probability (Utvärdera sannolikhet): Passar en angiven sannolikhetsfördelningsfunktion till en datauppsättning.
- Ersätt diskreta värden: Ersätter diskreta värden från en kolumn med numeriska värden baserat på en annan kolumn.
- Sammanfatta data: Genererar en grundläggande beskrivande statistikrapport för kolumnerna i en datauppsättning.
- Testhypotes med t-test: Jämför innebär från två datauppsättningar med hjälp av ett t-test.