R-språkmoduler
Viktigt
Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.
Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.
- Se information om hur du flyttar maskininlärningsprojekt från ML Studio (klassisk) till Azure Machine Learning.
- Läs mer om Azure Machine Learning.
Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.
Den här artikeln innehåller moduler i Machine Learning Studio (klassisk) som stöder körning av R-kod. De här modulerna gör det enklare att publicera R-modeller i produktion och att använda R-språks communityn för att lösa verkliga problem.
Anteckning
Gäller endast för: Machine Learning Studio (klassisk)
Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.
Den här artikeln beskriver också några allmänna krav för att använda R i Machine Language Studio (klassisk) och visar kända problem och tips.
Lista över moduler
Kategorin R-språkmoduler innehåller följande moduler:
- Kör R-skript: Kör ett R-skript från ett Machine Learning experiment.
- Skapa R-modell: Skapar en R-modell med hjälp av anpassade resurser.
Krav när du använder R
Observera följande krav innan du Machine Learning R-skript i Machine Learning Studio (klassisk):
Om du har importerat data som använder CSV eller andra format kan du inte läsa data direkt i CSV-format från R-koden. Använd i stället Konvertera till datauppsättning för att förbereda data innan du använder dem som indata till en R-modul.
När du kopplar Machine Learning datauppsättning som indata till en R-modul läses datauppsättningen automatiskt in i R-arbetsytan som en dataram med variabelnamnets datauppsättning.
Du kan dock definiera ytterligare dataramar eller ändra namnet på standardvariabeln för datauppsättningen i R-skriptet.
R-modulerna körs i en skyddad och isolerad miljö på din privata arbetsyta. På din arbetsyta kan du skapa dataramar och variabler för användning av flera moduler.
Du kan dock inte läsa in R-dataramar från en annan arbetsyta eller läsa variabler som skapats på en annan arbetsyta, även om arbetsytan är öppen i en Azure-session. Du kan inte heller använda moduler som har ett Java-beroende eller som kräver direkt nätverksåtkomst.
Optimering för R-bedömningsuppgifter
Implementeringen av R i Machine Learning Studio (klassisk) och arbetsytemiljö innehåller två huvudkomponenter. Den ena komponenten samordnar skriptkörningen och den andra ger snabb dataåtkomst och bedömning. Bedömningskomponenten är optimerad för att förbättra skalbarhet och prestanda.
Därför stöder R-arbetsytor i Machine Learning Studio (klassisk) även två typer av bedömningsuppgifter, som var och en är optimerad för olika krav. Du använder vanligtvis bedömning per fil när du skapar ett experiment. Du använder vanligtvis tjänsten för begärandesvar (RRS) för mycket snabb bedömning när du poängsättning som en del av en webbtjänst.
Stöd för R-paket och -version
Machine Learning Studio (klassisk) innehåller över 500 av de mest populära R-paketen. Vilka R-paket du kan välja bland beror på vilken R-version du väljer för experimentet:
- CRAN R
- Microsoft R Open (MRO 3.2.2 eller MRO 3.4.4)
När du skapar ett experiment måste du välja en enskild R-version att köra på för alla moduler i experimentet.
Lista över paket per version
En lista över de paket som för närvarande stöds i Machine Learning finns i R-paket som stöds av Machine Learning.
Du kan också lägga till följande kod i en Execute R Script-modul (Kör R-skript ) i experimentet och köra den för att hämta en datauppsättning som innehåller paketnamn och versioner. Se till att ange R-versionen i modulegenskaperna för att generera rätt lista för den avsedda miljön.
data.set <- data.frame(installed.packages())
maml.mapOutputPort("data.set")
Viktigt
Paketen som stöds i Machine Language Studio (klassisk) ändras ofta. Om du är osäker på om ett R-paket stöds kan du använda det R-kodexempel som tillhandahålls för att hämta en fullständig lista över paket i den aktuella miljön.
Utöka experiment med hjälp av R-språket
Det finns många sätt att utöka experimentet med hjälp av anpassade R-skript eller genom att lägga till R-paket. Här följer några idéer för att komma igång:
Använd R-kod för att utföra anpassade matematiska åtgärder. Det finns till exempel R-paket för att lösa differentiella ekvationer, generera slumpmässiga tal eller köra Monte Carlo-simuleringar.
Tillämpa anpassade transformningar för data. Du kan till exempel använda ett R-paket för att utföra interpolering på tidsseriedata eller utföra språklig analys.
Arbeta med olika datakällor. R-skriptmodulerna stöder ytterligare en uppsättning indata, som kan innehålla datafiler, i komprimerat format. Du kan använda komprimerade datafiler, tillsammans med R-paket som utformats för sådana datakällor, för att platta ut hierarkiska data till en platt datatabell. Du kan också använda dessa för att läsa data Excel och andra filformat.
Använd anpassade mått för utvärdering. I stället för att använda funktionerna i Evaluate kan du till exempel importera ett R-paket och sedan använda dess mått.
I följande exempel visas den övergripande processen för hur du kan installera nya paket och använda anpassad R-kod i experimentet.
Dela kolumner med hjälp av R
Ibland kräver data omfattande manipulering för att extrahera funktioner. Anta att du har en textfil som innehåller ett ID följt av värden och anteckningar, allt avgränsat med blanksteg. Eller anta att textfilen innehåller tecken som inte stöds av Machine Language Studio (klassisk).
Det finns flera R-paket som tillhandahåller specialiserade funktioner för sådana uppgifter. Bibliotekspaketet splitstackshape innehåller flera användbara funktioner för att dela upp flera kolumner, även om varje kolumn har olika avgränsare.
I följande exempel visas hur du installerar de nödvändiga paketen och delar upp kolumner. Du lägger till den här koden i modulen Execute R Script (Kör R-skript ).
#install dependent packages
install.packages("src/concat.split.multiple/data.table_1.9.2.zip", lib=".", repos = NULL, verbose = TRUE)
(success.data.table <- library("data.table", lib.loc = ".", logical.return = TRUE, verbose = TRUE))
install.packages("src/concat.split.multiple/plyr_1.8.1.zip", lib=".", repos = NULL, verbose = TRUE)
(success.plyr <- library("plyr", lib.loc = ".", logical.return = TRUE, verbose = TRUE))
install.packages("src/concat.split.multiple/Rcpp_0.11.2.zip", lib=".", repos = NULL, verbose = TRUE)
(success.Rcpp <- library("Rcpp", lib.loc = ".", logical.return = TRUE, verbose = TRUE))
install.packages("src/concat.split.multiple/reshape2_1.4.zip", lib=".", repos = NULL, verbose = TRUE)
(success.reshape2 <- library("reshape2", lib.loc = ".", logical.return = TRUE, verbose = TRUE))
#install actual packages
install.packages("src/concat.split.multiple/splitstackshape_1.2.0.zip", lib=".", repos = NULL, verbose = TRUE)
(success.splitstackshape <- library("splitstackshape", lib.loc = ".", logical.return = TRUE, verbose = TRUE))
#Load installed library
library(splitstackshape)
#Use library method to split & concat
data <- concat.split.multiple(maml.mapInputPort(1), c("TermsAcceptedUserClientIPAddress", "EmailAddress"), c(".", "@"))
#Print column names to console
colnames(data)
#Redirect data to output port
maml.mapOutputPort("data")
Ytterligare resurser
Börja med den här självstudien som beskriver hur du skapar en anpassad R-modul:
Den här artikeln beskriver skillnaderna mellan de två bedömningsmotorerna i detalj och förklarar hur du kan välja en bedömningsmetod när du distribuerar experimentet som en webbtjänst:
Det här experimentet i Azure AI Gallery visar hur du kan skapa en anpassad R-modul som gör träning, bedömning och utvärdering:
Den här artikeln, som publiceras på R-Bloggar, visar hur du kan skapa en egen utvärderingsmetod i Machine Learning:
Mer hjälp med R
Den här webbplatsen innehåller en kategoriserad lista över paket som du kan söka efter nyckelord:
Ytterligare R-kodexempel och hjälp med R och dess program finns i följande resurser:
R Project: Den officiella webbplatsen för R-språket.
Rseek: En sökmotor för R-resurser.
R-bloggar: En sammanställning av bloggar i R-communityn.
CRAN: Den största lagringsplatsen för R-paket.
Quick-R: En bra R-självstudie.
Webbsemin: Lär dig hur du får snabbare slutresultat från dina R-modeller
Bioledare: En stor lagringsplats med R-paket i bioinformatik.