Dela via


ML (klassisk) modulbeskrivningar i Studio

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Det här avsnittet innehåller en översikt över alla moduler som ingår i Machine Learning Studio (klassisk), som är en interaktiv, visuell arbetsyta för att enkelt skapa och testa förutsägelsemodeller.

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Vad är en modul?

I Machine Learning Studio (klassisk) är en modul ett byggblock för att skapa experiment. Varje modul kapslar in en specifik maskininlärningsalgoritm, funktion eller kodbibliotek som kan agera på data på din arbetsyta. Modulerna är utformade för att acceptera anslutningar från andra moduler för att dela och ändra data.

Koden som körs i varje modul kommer från många källor. Dessa omfattar öppen källkod och språk, algoritmer som utvecklats av Microsoft Research och verktyg för att arbeta med Azure och andra molntjänster.

Tips

Letar du efter maskininlärningsalgoritmer? Se kategorin Machine Learning, som innehåller moduler för beslutsträd, klustring, neurala nätverk med mera. Kategorierna Tränaoch Utvärdera innehåller moduler som hjälper dig att träna och testa dina modeller.

Genom att ansluta och konfigurera moduler kan du skapa ett arbetsflöde som läser data från externa källor, förbereder dem för analys, tillämpar maskininlärningsalgoritmer och genererar resultat.

När ett experiment är öppet i Machine Learning Studio (klassisk) kan du se en fullständig lista över aktuella moduler i navigeringsfönstret till vänster. Du drar dessa byggstenar till experimentet och ansluter dem sedan för att skapa ett fullständigt maskininlärningsarbetsflöde, som kallas för ett experiment.

Ibland uppdateras moduler för att lägga till nya funktioner eller för att ta bort äldre kod. När detta inträffar fortsätter alla experiment som du har skapat och som använder modulen att köras. Nästa gång du öppnar experimentet uppmanas du dock att uppgradera modulen eller att använda en annan modul.

Exempel

Ett exempel på hur du skapar ett fullständigt maskininlärningsexperiment finns i följande självstudier:

Modulkategorier

För att göra det lättare att hitta relaterade moduler grupperas maskininlärningsverktygen i Machine Learning Studio (klassisk) efter dessa kategorier.

Dataformatkonverteringar

Använd de här modulerna för att konvertera data till något av de format som används av andra maskininlärningsverktyg eller -format.

  • Indata och utdata

    Använd de här modulerna för att läsa data och modeller från molndatakällor, inklusive Hadoop-kluster, Azure Table Storage och webb-URL:er. Du kan också använda dessa moduler för att skriva resultat till lagring eller till en databas.

  • Datatransformering

    Använd de här modulerna för att förbereda data för analys. Du kan ändra datatyper, flagga kolumner som funktioner eller etiketter, generera funktioner och skala eller normalisera data.

  • Filter

    Transformera numeriska data som härletts från digital signalbearbetning.

  • Learning med antal

    Använd gemensamma sannolikhetsfördelningar för att skapa funktioner som på ett kompakt sätt beskriver stora datamängder.

  • Manipulation

    Den här gruppen innehåller en mängd olika verktyg för datavetenskap. Du kan till exempel ta bort eller ersätta saknade värden, välja en delmängd av kolumner, lägga till en kolumn eller sammanfoga två datauppsättningar.

  • Exempel och delning

    Dividera en datauppsättning med kriterier eller efter storlek, för att skapa tränings- och testuppsättningar eller för att isolera vissa rader.

  • Skala och minska

    Transformera numeriska data.

Funktionsval

Använd de här modulerna för att identifiera de bästa funktionerna i dina data med hjälp av statistiska metoder som ofta undersökas.

Machine Learning

Den här gruppen innehåller de flesta maskininlärningsalgoritmer som stöds av Machine Learning.

Den innehåller även moduler som är avsedda att stödja algoritmer genom att träna modeller, generera poäng och utvärdera modellens prestanda.

  • Utvärdera

    När du har tränat en modell kan du använda dessa verktyg för att mäta modellens noggrannhet.

  • Initiera

    De här modulerna tillhandahåller maskininlärningsalgoritmer som du kan anpassa genom att ange parametrar. Algoritmerna i det här avsnittet är grupperade efter typ:

  • Poäng

    Använd de här modulerna för att skicka nya data via algoritmen och generera en uppsättning resultat för utvärdering. Du kan också använda resultatet av bedömning som en del av en förutsägelsetjänst.

  • Träna

    De här modulerna tränar en initierad maskininlärningsmodell på data som du anger.

OpenCV-biblioteksmoduler

Dessa moduler ger dig enkel åtkomst till ett populärt öppen källkod för bildbearbetning och bildklassificering.

R-språkmoduler

Använd de här modulerna för att lägga till anpassad R-kod i experimentet eller implementera en maskininlärningsmodell som baseras på ett R-paket.

Python-språkmoduler

Använd de här modulerna för att lägga till anpassad Python-kod i experimentet.

Statistikfunktioner

Använd de här modulerna för att beräkna sannolikhetsfördelningar, skapa anpassade beräkningar och utföra en mängd andra uppgifter relaterade till numeriska variabler.

Textanalys

Använd de här modulerna för att utföra funktions-hashing och namngiven entitetsigenkänning, eller förbearbeta text med hjälp av bearbetningsverktyg för naturligt språk.

Tidsserie

Använd de här modulerna för att utvärdera avvikelser i trender med hjälp av algoritmer som är särskilt utformade för tidsseriedata.

Machine Learning Studio-moduler (klassisk) försöker inte duplicera dataintegreringsverktyg som stöds i andra verktyg, till exempel Azure Data Factory. Modulerna innehåller i stället funktioner som är specifika för maskininlärning:

  • Normalisering, gruppering och skalning av data
  • Beräkning av statistisk fördelning av data
  • Konvertering till andra maskininlärningsformat
  • Import av data som används för maskininlärningsexperiment och export av resultat
  • Textanalys, funktionsval och minskning av antalet dimensioner

Om du behöver mer avancerade funktioner för datamanipulering och lagring kan du läsa följande:

Se även