Uso do R no Editor do Power Query
A linguagem R é uma linguagem de programação poderosa que muitos estatísticos, cientistas de dados e analistas de dados usam. Você pode usar R no Editor do Power Query do Power BI Desktop para:
- preparar modelos de dados.
- criar relatórios.
- Faça limpeza de dados, formatação avançada de dados e análise de modelo semântico, que incluem conclusão de dados ausentes, previsões, clustering e muito mais.
Instalar o R
Você pode baixar o R gratuitamente no CRAN Repository.
Instalar o mice
Como pré-requisito, você precisa instalar a biblioteca do mice em seu ambiente de R. Sem o mice, o código do script de exemplo não funciona corretamente. O pacote da mice implementa um método para lidar com os dados ausentes.
Para instalar a biblioteca do mice:
Inicie o programa
R.exe
, por exemplo,C:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe
.Execute o comando install no prompt do R:
install.packages('mice')
Usar um script do R no Editor do Power Query
Para demonstrar o uso do R no Editor do Power Query, este exemplo usa um modelo semântico do mercado de ações contido em um arquivo .csv.
Baixe o arquivo EuStockMarkets_NA.csv. Lembre-se do local em que você o salvou.
Carregue o arquivo no Power BI Desktop. Na guia Página Inicial, selecione Obter dados>Texto/CSV.
Selecione o arquivo EuStockMarkets_NA.csv e, em seguida, escolha Abrir. Os dados CSV são exibidos na caixa de diálogo Arquivo de texto/CSV.
Selecione Carregar para carregar os dados do arquivo. Após o Power BI Desktop ter carregado os dados, a nova tabela aparecerá no painel Campos.
Para abrir o Editor do Power Query, na faixa de opções Página Inicial, selecione Transformar dados.
Na guia Transformar, selecione o botão Executar Script R. O editor Executar Script R é exibido. As linhas 15 e 20 têm dados ausentes, assim como outras linhas que você não pode ver na imagem. As etapas a seguir mostram como o R completa essas linhas para você.
Para este exemplo, insira o seguinte código de script na caixa Script da janela Executar Script R.
library(mice) tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100) completedData <- complete(tempData,1) output <- dataset output$completedValues <- completedData$"SMI missing values"
Observação
Talvez seja necessário substituir uma variável nomeada saída para criar corretamente o novo modelo semântico com os filtros aplicados.
Selecione OK. O Editor do Power Query exibe um aviso sobre a privacidade dos dados.
Dentro da mensagem de aviso, selecione Continuar. Na caixa de diálogo Níveis de privacidade que é exibida, defina todas as fontes de dados como Público para que os scripts de R funcionem corretamente no serviço do Power BI.
Para obter mais informações sobre as configurações de privacidade e suas implicações, confira Níveis de privacidade do Power BI Desktop.
Selecione Salvar para executar o script.
Ao executar o script, você verá o seguinte resultado:
Quando você seleciona Tabela ao lado de Saída na tabela que aparece, a tabela é apresentada, conforme mostrado na imagem a seguir.
Observe a nova coluna no painel Campos chamada completedValues. A coluna valores ausentes do SMI tem alguns elementos de dados ausentes. Veja como o R lida com isso na próxima seção.
Com apenas cinco linhas de script de R, o Editor do Power Query preencheu os valores ausentes com um modelo preditivo.
Criar elementos visuais com base em dados de script R
Agora, podemos criar um visual para ver como o código do script de R com a biblioteca do mice completa os valores ausentes.
Você pode salvar todos os visuais concluídos em um arquivo .pbix do Power BI Desktop e usar o modelo de dados e os respectivos scripts do R no serviço do Power BI.
Observação
Você pode baixar um arquivo .pbix com todas essas etapas concluídas.
Depois de carregar o arquivo .pbix no serviço do Power BI, você precisará executar etapas adicionais para habilitar a atualização de dados de serviço e os visuais atualizados:
Habilitar a atualização agendada para o modelo semântico: para habilitar a atualização agendada para a pasta de trabalho que contém seu modelo semântico com scripts R, consulte Configurar a atualização agendada. Este artigo também inclui informações sobre gateways de dados local.
Instalar um gateway: é necessário instalar um gateway de dados local (modo pessoal) no computador em que o arquivo e o R estão localizados. O serviço do Power BI acessa essa pasta de trabalho e renderiza novamente todos os visuais que foram atualizados. Para obter mais informações, confira Usar gateways pessoais no Power BI.
Considerações e limitações
Há algumas limitações para consultas que incluem scripts de R criados no Editor do Power Query:
Todas as configurações de fonte de dados do R devem ser definidas como públicas. Todas as outras etapas em uma consulta do Editor do Power Query também devem ser públicas.
Para obter as configurações de fonte de dados, no Power BI Desktop, selecione Arquivo>Opções e configurações>Configurações de fonte de dados.
Na caixa de diálogo Configurações de fonte de dados, selecione uma ou mais fontes de dados e, em seguida, selecione Editar Permissões. Defina o Nível de Privacidade como Público.
Para agendar a atualização de seus visuais R ou modelo semântico, habilite a atualização agendada e instale um gateway de dados local (modo pessoal) no computador que contém a pasta de trabalho e o R. Você não pode usar um gateway empresarial para atualizar modelos semânticos que contêm scripts R no Power Query.
Conteúdo relacionado
Há inúmeras coisas que você pode fazer com o R e com consultas personalizadas. Explore e formate seus dados exatamente como você deseja que eles apareçam.