ML (klassisk) modulbeskrivningar i Studio
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
Det här avsnittet innehåller en översikt över alla moduler som ingår i Machine Learning Studio (klassisk), som är en interaktiv, visuell arbetsyta för att enkelt skapa och testa förutsägelsemodeller.
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Vad är en modul?
I Machine Learning Studio (klassisk) är en modul ett byggblock för att skapa experiment. Varje modul kapslar in en specifik maskininlärningsalgoritm, funktion eller kodbibliotek som kan agera på data på din arbetsyta. Modulerna är utformade för att acceptera anslutningar från andra moduler för att dela och ändra data.
Koden som körs i varje modul kommer från många källor. Dessa omfattar öppen källkod och språk, algoritmer som utvecklats av Microsoft Research och verktyg för att arbeta med Azure och andra molntjänster.
Tips
Letar du efter maskininlärningsalgoritmer? Se kategorin Machine Learning, som innehåller moduler för beslutsträd, klustring, neurala nätverk med mera. Kategorierna Tränaoch Utvärdera innehåller moduler som hjälper dig att träna och testa dina modeller.
Genom att ansluta och konfigurera moduler kan du skapa ett arbetsflöde som läser data från externa källor, förbereder dem för analys, tillämpar maskininlärningsalgoritmer och genererar resultat.
När ett experiment är öppet i Machine Learning Studio (klassisk) kan du se en fullständig lista över aktuella moduler i navigeringsfönstret till vänster. Du drar dessa byggstenar till experimentet och ansluter dem sedan för att skapa ett fullständigt maskininlärningsarbetsflöde, som kallas för ett experiment.
Ibland uppdateras moduler för att lägga till nya funktioner eller för att ta bort äldre kod. När detta inträffar fortsätter alla experiment som du har skapat och som använder modulen att köras. Nästa gång du öppnar experimentet uppmanas du dock att uppgradera modulen eller att använda en annan modul.
Exempel
Ett exempel på hur du skapar ett fullständigt maskininlärningsexperiment finns i följande självstudier:
Utveckla en förutsägelselösning med hjälp av Machine Learning
Skapa ett enkelt experiment i Machine Learning Studio (klassisk)
Modulkategorier
För att göra det lättare att hitta relaterade moduler grupperas maskininlärningsverktygen i Machine Learning Studio (klassisk) efter dessa kategorier.
Dataformatkonverteringar
Använd de här modulerna för att konvertera data till något av de format som används av andra maskininlärningsverktyg eller -format.
-
Använd de här modulerna för att läsa data och modeller från molndatakällor, inklusive Hadoop-kluster, Azure Table Storage och webb-URL:er. Du kan också använda dessa moduler för att skriva resultat till lagring eller till en databas.
-
Använd de här modulerna för att förbereda data för analys. Du kan ändra datatyper, flagga kolumner som funktioner eller etiketter, generera funktioner och skala eller normalisera data.
-
Transformera numeriska data som härletts från digital signalbearbetning.
-
Använd gemensamma sannolikhetsfördelningar för att skapa funktioner som på ett kompakt sätt beskriver stora datamängder.
-
Den här gruppen innehåller en mängd olika verktyg för datavetenskap. Du kan till exempel ta bort eller ersätta saknade värden, välja en delmängd av kolumner, lägga till en kolumn eller sammanfoga två datauppsättningar.
-
Dividera en datauppsättning med kriterier eller efter storlek, för att skapa tränings- och testuppsättningar eller för att isolera vissa rader.
-
Transformera numeriska data.
Funktionsval
Använd de här modulerna för att identifiera de bästa funktionerna i dina data med hjälp av statistiska metoder som ofta undersökas.
Machine Learning
Den här gruppen innehåller de flesta maskininlärningsalgoritmer som stöds av Machine Learning.
Den innehåller även moduler som är avsedda att stödja algoritmer genom att träna modeller, generera poäng och utvärdera modellens prestanda.
-
När du har tränat en modell kan du använda dessa verktyg för att mäta modellens noggrannhet.
-
De här modulerna tillhandahåller maskininlärningsalgoritmer som du kan anpassa genom att ange parametrar. Algoritmerna i det här avsnittet är grupperade efter typ:
-
Använd de här modulerna för att skicka nya data via algoritmen och generera en uppsättning resultat för utvärdering. Du kan också använda resultatet av bedömning som en del av en förutsägelsetjänst.
-
De här modulerna tränar en initierad maskininlärningsmodell på data som du anger.
OpenCV-biblioteksmoduler
Dessa moduler ger dig enkel åtkomst till ett populärt öppen källkod för bildbearbetning och bildklassificering.
R-språkmoduler
Använd de här modulerna för att lägga till anpassad R-kod i experimentet eller implementera en maskininlärningsmodell som baseras på ett R-paket.
Python-språkmoduler
Använd de här modulerna för att lägga till anpassad Python-kod i experimentet.
Statistikfunktioner
Använd de här modulerna för att beräkna sannolikhetsfördelningar, skapa anpassade beräkningar och utföra en mängd andra uppgifter relaterade till numeriska variabler.
Textanalys
Använd de här modulerna för att utföra funktions-hashing och namngiven entitetsigenkänning, eller förbearbeta text med hjälp av bearbetningsverktyg för naturligt språk.
Tidsserie
Använd de här modulerna för att utvärdera avvikelser i trender med hjälp av algoritmer som är särskilt utformade för tidsseriedata.
Relaterade uppgifter
Machine Learning Studio-moduler (klassisk) försöker inte duplicera dataintegreringsverktyg som stöds i andra verktyg, till exempel Azure Data Factory. Modulerna innehåller i stället funktioner som är specifika för maskininlärning:
- Normalisering, gruppering och skalning av data
- Beräkning av statistisk fördelning av data
- Konvertering till andra maskininlärningsformat
- Import av data som används för maskininlärningsexperiment och export av resultat
- Textanalys, funktionsval och minskning av antalet dimensioner
Om du behöver mer avancerade funktioner för datamanipulering och lagring kan du läsa följande:
- Azure Data Factory: Företagsklara pipelines för databehandling i molnet.
- Azure SQL Database: Skalbar lagring med integrerad åtkomst till maskininlärning.
- CosmosDB: NoSQL-datalager; importera data till Machine Learning Studio (klassisk).
- Azure Data Lake Analytics: Distribuerad analys på stordata.
- Stream Analytics: Händelsebearbetning för Sakernas Internet.
- Azure Textanalys: Flera alternativ för textbearbetning och relaterade Cognitive Services för tal-, bild- och ansiktsigenkänning.
- Azure Databricks: Spark-baserad analysplattform.