Módulos de linguagem R
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
este artigo lista os módulos no Machine Learning Studio (clássico) que dão suporte ao código R em execução. Esses módulos facilitam a publicação de modelos R em produção e o uso da experiência da comunidade de linguagem R para resolver problemas do mundo real.
Observação
aplica-se a: somente Machine Learning Studio (clássico)
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Este artigo também descreve alguns requisitos gerais para usar o R no Machine Language Studio (clássico) e lista problemas conhecidos e dicas.
Lista de módulos
A categoria módulos de linguagem R inclui os seguintes módulos:
- executar script r: executa um script r de um experimento Machine Learning.
- Criar modelo de r: cria um modelo de r usando recursos personalizados.
Requisitos ao usar o R
antes de usar o script R no Machine Learning Studio (clássico), observe os seguintes requisitos:
Se você importou dados que usam CSV ou outros formatos, não é possível ler os dados diretamente no formato CSV do código R. Em vez disso, use converter em DataSet para preparar os dados, antes de usá-los como entrada para um módulo R.
quando você anexa qualquer conjunto de dados Machine Learning como entrada para um módulo do r, o conjunto de dados é carregado automaticamente no espaço de trabalho do r como um data frame, com o nome da variável dataset.
No entanto, você pode definir quadros de dados adicionais ou alterar o nome da variável DataSet padrão no script R.
Os módulos do R são executados em um ambiente protegido e isolado dentro do seu espaço de trabalho privado. Em seu workspace, você pode criar quadros de dados e variáveis para uso por vários módulos.
No entanto, você não pode carregar quadros de dados do R de um espaço de trabalho diferente ou ler variáveis criadas em um espaço de trabalho diferente, mesmo se esse espaço de trabalho estiver aberto em uma sessão do Azure. Além disso, você não pode usar módulos que têm uma dependência de Java ou que exigem acesso direto à rede.
Otimização para tarefas de Pontuação de R
a implementação do R no ambiente do Machine Learning Studio (clássico) e do espaço de trabalho inclui dois componentes principais. Um componente coordena a execução do script e o outro fornece acesso a dados de alta velocidade e pontuação. O componente de pontuação é otimizado para melhorar a escalabilidade e o desempenho.
portanto, os espaços de trabalho do R no Machine Learning Studio (clássico) também dão suporte a dois tipos de tarefas de pontuação, cada uma otimizada para requisitos diferentes. Normalmente, você usa a pontuação em uma base arquivo por arquivo ao criar um experimento. Normalmente, você usa o RRS (serviço de resposta de solicitação) para Pontuação muito rápida, quando você está pontuando como parte de um serviço Web.
Suporte a pacote e versão do R
o Machine Learning Studio (clássico) inclui mais de 500 dos pacotes R mais populares. Os pacotes do R que você pode selecionar dependem da versão do R que você selecionar para o experimento:
- CRAN R
- Microsoft R Open (MRO 3.2.2 ou MRO 3.4.4)
Sempre que você criar um experimento, deverá escolher uma única versão do R para executar, para todos os módulos em seu experimento.
Lista de pacotes por versão
para obter uma lista dos pacotes que têm suporte no momento no Machine Learning, consulte pacotes de R com suporte pelo Machine Learning.
Você também pode adicionar o código a seguir a um módulo Executar script R em seu experimento e executá-lo para obter um conjunto de módulos contendo nomes e versões de pacote. Certifique-se de definir a versão do R nas propriedades do módulo para gerar a lista correta para o ambiente desejado.
data.set <- data.frame(installed.packages())
maml.mapOutputPort("data.set")
Importante
Os pacotes que têm suporte no estúdio de linguagem de máquina (clássico) mudam com frequência. Se você tiver qualquer dúvida sobre se há suporte para um pacote R, use o exemplo de código R fornecido para obter a lista completa de pacotes no ambiente atual.
Estender experimentos usando a linguagem R
Há várias maneiras que você pode estender sua experiência usando o script R personalizado ou adicionando pacotes de R. Aqui estão algumas ideias para você começar:
Use o código R para executar operações matemáticas personalizadas. Por exemplo, há pacotes R para resolver equações diferenciais, gerar números aleatórios ou executar simulações de Monte Carlo.
Aplicar transformações personalizadas para dados. Por exemplo, você pode usar um pacote R para executar a interpolação em dados de série temporal ou executar análise linguística.
Trabalhe com fontes de dados diferentes. Os módulos de script R oferecem suporte a um conjunto adicional de entradas, que podem incluir arquivos de dados, no formato compactado. Você pode usar arquivos de dados compactados, juntamente com pacotes de R projetados para essas fontes de dados, para mesclar dados hierárquicos em uma tabela de dados simples. você também pode usá-los para ler dados de Excel e outros formatos de arquivo.
Use métricas personalizadas para avaliação. Por exemplo, em vez de usar as funções fornecidas em Evaluate, você pode importar um pacote de R e, em seguida, aplicar suas métricas.
O exemplo a seguir demonstra o processo geral de como você pode instalar novos pacotes e usar código R personalizado em seu experimento.
Dividir colunas usando R
Às vezes, os dados requerem manipulação extensiva para extrair recursos. Suponha que você tenha um arquivo de texto que contenha uma ID seguida por valores e observações, todos separados por espaços. Ou então, suponha que o arquivo de texto contém caracteres que não têm suporte do Machine idioma Studio (clássico).
Há vários pacotes de R que fornecem funções especializadas para essas tarefas. O pacote de biblioteca splitstackshape contém várias funções úteis para dividir várias colunas, mesmo que cada coluna tenha um delimitador diferente.
O exemplo a seguir ilustra como instalar os pacotes necessários e separar colunas. Você adicionaria esse código ao módulo Executar script R .
#install dependent packages
install.packages("src/concat.split.multiple/data.table_1.9.2.zip", lib=".", repos = NULL, verbose = TRUE)
(success.data.table <- library("data.table", lib.loc = ".", logical.return = TRUE, verbose = TRUE))
install.packages("src/concat.split.multiple/plyr_1.8.1.zip", lib=".", repos = NULL, verbose = TRUE)
(success.plyr <- library("plyr", lib.loc = ".", logical.return = TRUE, verbose = TRUE))
install.packages("src/concat.split.multiple/Rcpp_0.11.2.zip", lib=".", repos = NULL, verbose = TRUE)
(success.Rcpp <- library("Rcpp", lib.loc = ".", logical.return = TRUE, verbose = TRUE))
install.packages("src/concat.split.multiple/reshape2_1.4.zip", lib=".", repos = NULL, verbose = TRUE)
(success.reshape2 <- library("reshape2", lib.loc = ".", logical.return = TRUE, verbose = TRUE))
#install actual packages
install.packages("src/concat.split.multiple/splitstackshape_1.2.0.zip", lib=".", repos = NULL, verbose = TRUE)
(success.splitstackshape <- library("splitstackshape", lib.loc = ".", logical.return = TRUE, verbose = TRUE))
#Load installed library
library(splitstackshape)
#Use library method to split & concat
data <- concat.split.multiple(maml.mapInputPort(1), c("TermsAcceptedUserClientIPAddress", "EmailAddress"), c(".", "@"))
#Print column names to console
colnames(data)
#Redirect data to output port
maml.mapOutputPort("data")
Recursos adicionais
Comece com este tutorial que descreve como criar um módulo R personalizado:
Este artigo discute as diferenças entre os dois mecanismos de pontuação em detalhes e explica como você pode escolher um método de pontuação ao implantar seu teste como um serviço Web:
Esse experimento na Galeria de IA do Azure demonstra como você pode criar um módulo R personalizado que faz treinamento, pontuação e avaliação:
Este artigo, publicado em R-bloggers, demonstra como você pode criar seu próprio método de avaliação no Machine Learning:
Mais ajuda com o R
Este site fornece uma lista categorizada de pacotes que você pode pesquisar por palavras-chave:
Para exemplos de código de R adicionais e ajudar com o R e seus aplicativos, consulte estes recursos:
r Project: o site oficial da linguagem R.
Rseek: um mecanismo de pesquisa para recursos de R.
R-bloggers: uma agregação de Blogs na Comunidade do r.
Cran: o maior repositório de pacotes de R.
Rápido-r: um bom tutorial de r.
Webinar: saiba como obter resultados finais mais rápidos de seus modelos de R
Biocondutor: um grande repositório de pacotes de R em Bioinformática.