Compartilhar via


Uso do R no Editor do Power Query

A linguagem R é uma linguagem de programação poderosa que muitos estatísticos, cientistas de dados e analistas de dados usam. Você pode usar R no Editor do Power Query do Power BI Desktop para:

  • preparar modelos de dados.
  • criar relatórios.
  • Faça limpeza de dados, formatação avançada de dados e análise de modelo semântico, que incluem conclusão de dados ausentes, previsões, clustering e muito mais.

Instalar o R

Você pode baixar o R gratuitamente no CRAN Repository.

Instalar o mice

Como pré-requisito, você precisa instalar a biblioteca do mice em seu ambiente de R. Sem o mice, o código do script de exemplo não funciona corretamente. O pacote da mice implementa um método para lidar com os dados ausentes.

Para instalar a biblioteca do mice:

  1. Inicie o programa R.exe, por exemplo, C:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe.

  2. Execute o comando install no prompt do R:

    install.packages('mice') 
    

Usar um script do R no Editor do Power Query

Para demonstrar o uso do R no Editor do Power Query, este exemplo usa um modelo semântico do mercado de ações contido em um arquivo .csv.

  1. Baixe o arquivo EuStockMarkets_NA.csv. Lembre-se do local em que você o salvou.

  2. Carregue o arquivo no Power BI Desktop. Na guia Página Inicial, selecione Obter dados>Texto/CSV.

    Screenshot shows the Get data option where you can select Text/CSV.

  3. Selecione o arquivo EuStockMarkets_NA.csv e, em seguida, escolha Abrir. Os dados CSV são exibidos na caixa de diálogo Arquivo de texto/CSV.

    Screenshot shows the contents of the selected .csv file.

  4. Selecione Carregar para carregar os dados do arquivo. Após o Power BI Desktop ter carregado os dados, a nova tabela aparecerá no painel Campos.

    Screenshot shows data in the Fields pane.

  5. Para abrir o Editor do Power Query, na faixa de opções Página Inicial, selecione Transformar dados.

    Screenshot shows the Home ribbon with Transform data highlighted.

  6. Na guia Transformar, selecione o botão Executar Script R. O editor Executar Script R é exibido. As linhas 15 e 20 têm dados ausentes, assim como outras linhas que você não pode ver na imagem. As etapas a seguir mostram como o R completa essas linhas para você.

    [Screenshot shows Power Query Editor with Run R Script selected.

  7. Para este exemplo, insira o seguinte código de script na caixa Script da janela Executar Script R.

       library(mice)
       tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100)
       completedData <- complete(tempData,1)
       output <- dataset
       output$completedValues <- completedData$"SMI missing values"
    

    Observação

    Talvez seja necessário substituir uma variável nomeada saída para criar corretamente o novo modelo semântico com os filtros aplicados.

  8. Selecione OK. O Editor do Power Query exibe um aviso sobre a privacidade dos dados.

    Screenshot shows data privacy warning with a Continue option.

  9. Dentro da mensagem de aviso, selecione Continuar. Na caixa de diálogo Níveis de privacidade que é exibida, defina todas as fontes de dados como Público para que os scripts de R funcionem corretamente no serviço do Power BI.

    Screenshot shows the Privacy levels dialog with Public privacy selected.

    Para obter mais informações sobre as configurações de privacidade e suas implicações, confira Níveis de privacidade do Power BI Desktop.

  10. Selecione Salvar para executar o script.

    Ao executar o script, você verá o seguinte resultado:

    Screenshot of results of R script.

    Quando você seleciona Tabela ao lado de Saída na tabela que aparece, a tabela é apresentada, conforme mostrado na imagem a seguir.

    Screenshot of table results from R script.

    Observe a nova coluna no painel Campos chamada completedValues. A coluna valores ausentes do SMI tem alguns elementos de dados ausentes. Veja como o R lida com isso na próxima seção.

    Com apenas cinco linhas de script de R, o Editor do Power Query preencheu os valores ausentes com um modelo preditivo.

Criar elementos visuais com base em dados de script R

Agora, podemos criar um visual para ver como o código do script de R com a biblioteca do mice completa os valores ausentes.

Screenshot shows an R script visual that includes missing values and completed values.

Você pode salvar todos os visuais concluídos em um arquivo .pbix do Power BI Desktop e usar o modelo de dados e os respectivos scripts do R no serviço do Power BI.

Observação

Você pode baixar um arquivo .pbix com todas essas etapas concluídas.

Depois de carregar o arquivo .pbix no serviço do Power BI, você precisará executar etapas adicionais para habilitar a atualização de dados de serviço e os visuais atualizados:

  • Habilitar a atualização agendada para o modelo semântico: para habilitar a atualização agendada para a pasta de trabalho que contém seu modelo semântico com scripts R, consulte Configurar a atualização agendada. Este artigo também inclui informações sobre gateways de dados local.

  • Instalar um gateway: é necessário instalar um gateway de dados local (modo pessoal) no computador em que o arquivo e o R estão localizados. O serviço do Power BI acessa essa pasta de trabalho e renderiza novamente todos os visuais que foram atualizados. Para obter mais informações, confira Usar gateways pessoais no Power BI.

Considerações e limitações

Há algumas limitações para consultas que incluem scripts de R criados no Editor do Power Query:

  • Todas as configurações de fonte de dados do R devem ser definidas como públicas. Todas as outras etapas em uma consulta do Editor do Power Query também devem ser públicas.

    Para obter as configurações de fonte de dados, no Power BI Desktop, selecione Arquivo>Opções e configurações>Configurações de fonte de dados.

    Screenshot shows the Options and Settings dialog where you can select Data source settings.

    Na caixa de diálogo Configurações de fonte de dados, selecione uma ou mais fontes de dados e, em seguida, selecione Editar Permissões. Defina o Nível de Privacidade como Público.

    Screenshot shows Data source settings dialog where you can edit permissions.

  • Para agendar a atualização de seus visuais R ou modelo semântico, habilite a atualização agendada e instale um gateway de dados local (modo pessoal) no computador que contém a pasta de trabalho e o R. Você não pode usar um gateway empresarial para atualizar modelos semânticos que contêm scripts R no Power Query.

Há inúmeras coisas que você pode fazer com o R e com consultas personalizadas. Explore e formate seus dados exatamente como você deseja que eles apareçam.