Tutorial: Malha para usuários do Power BI
Neste tutorial, você aprenderá a usar Dataflows Gen2 e Pipelines para ingerir dados em um Lakehouse e criar um modelo dimensional. Você também aprende como gerar um belo relatório automaticamente para exibir os números de vendas mais recentes do início ao fim em apenas 45 minutos.
Vamos começar.
- Preparar e carregar dados em uma casa de lago
- Construa um modelo dimensional em uma casa do lago
- Criar automaticamente um relatório com a criação rápida
Pré-requisitos
- Antes de começar, peça ao administrador do Fabric para habilitar o Fabric para sua organização
- Se você ainda não está inscrito, inscreva-se para uma avaliação gratuita.
- Crie um novo espaço de trabalho e atribua uma capacidade de malha.
- Um espaço de trabalho existente também pode ser usado, embora seja recomendável usar um espaço de trabalho que não seja de produção para simplificar o tutorial.
- Transfira o ficheiro de modelo do Power Query que contém consultas de exemplo para dados da Contoso.
Criar uma casa de lago para armazenar dados
Começamos criando um lakehouse para armazenar nossos dados, Dataflows Gen2 para preparar e transformar colunas e um pipeline para lidar com a orquestração de uma atualização agendada e atividade de e-mail.
Navegue até o espaço de trabalho e selecione Novo. Em seguida, selecione Mais opções.
Na tela Criação de novo item, selecione Lakehouse na categoria Engenharia de dados.
Defina o nome Lakehouse como SalesLakehouse. Depois, selecione Criar.
Quando estiver no editor Lakehouse, selecione New Dataflow Gen2.
Nota
Você também pode selecionar Obter dados da faixa de opções e, em seguida, Novo Fluxo de Dados Gen2.
Prepare e carregue dados em sua casa do lago
Siga as seguintes etapas para carregar dados em sua casa no lago:
Quando estiver no editor do Power Query Online para Dataflows Gen2, selecione Importar de um modelo do Power Query e escolha o ficheiro de modelo transferido a partir dos pré-requisitos.
Selecione a consulta DimDate no grupo de consulta Carga de dados e, em seguida, selecione Configurar conexão. Se necessário, defina o tipo de autenticação como Anônimo antes de selecionar Conectar.
Com a consulta DimDate selecionada, na janela de visualização de dados, altere o tipo de dados da coluna DateKey para Data/Hora selecionando o ícone no canto superior esquerdo.
Selecione Substituir corrente na janela Alterar tipo de coluna.
Adicionar um destino de dados
Execute as seguintes etapas para adicionar um destino de dados:
Com a tabela DimDate selecionada, na guia Página Inicial, selecione Adicionar destino de dados e, em seguida, selecione o item de menu de opções Lakehouse.
Se necessário, defina a autenticação como Conta organizacional e selecione Avançar.
No navegador, selecione o espaço de trabalho usado para este tutorial e expanda para visualizar todos os itens do Lakehouse . Selecione SalesLakehouse e confirme se a tabela padrão Nova está selecionada antes de selecionar Avançar para continuar.
Defina o método Update como Replace e selecione Save settings.
Atenção
Definir o método de atualização como Substituir exclui todos os dados existentes e os substitui pelos novos dados em cada atualização subsequente.
Nota
No canto inferior direito do editor do Power Query Online, pode encontrar as definições de destino de dados configuradas para a sua consulta, onde pode personalizar ou remover ainda mais.
Antes de passar para a próxima seção deste tutorial, certifique-se de executar as mesmas etapas que você executou anteriormente nesta seção para configurar o Lakehouse como seu destino de dados para cada uma das consultas a seguir.
Query DimCustomer DimEmployee DimProduct DimStore Selecione a consulta FactOnlineSales no grupo de consultas Transformação de dados. Na guia Página Inicial, selecione Adicionar destino de dados. Selecione a opção Lakehouse .
Se necessário, defina a autenticação como Conta organizacional e selecione Avançar.
No navegador, selecione o espaço de trabalho usado para este tutorial e expanda para visualizar todos os itens do Lakehouse . Selecione SalesLakehouse e confirme se a tabela padrão Nova está selecionada antes de selecionar Avançar para continuar.
Defina o método Update como Append e selecione Save settings.
Nota
Esse processo insere dados, preservando as linhas existentes dentro da tabela em cada atualização subsequente.
Selecione Publicar para guardar o fluxo de dados e sair do editor do Power Query Online .
Passe o cursor sobre o fluxo de dados criado em seu espaço de trabalho, selecione as reticências (...) e a opção Propriedades .
Altere o nome do fluxo de dados para OnlineSalesDataflow e selecione Salvar.
Orquestre um pipeline de dados
Usando pipelines, primeiro orquestramos a atualização de nosso fluxo de dados. Se ocorrer um erro, enviamos um e-mail personalizado do Outlook que inclui detalhes importantes.
Selecione o item Lakehouse chamado SalesLakehouse em seu espaço de trabalho.
Quando estiver no editor Lakehouse, selecione Novo pipeline de dados.
Nota
Você também pode selecionar Obter dados da faixa de opções e, em seguida, Novo pipeline de dados.
Defina o nome do pipeline como SalesPipeline. Depois, selecione Criar.
Feche o Assistente de cópia de dados selecionando Cancelar. Se você for solicitado a confirmar a saída da janela de cópia de dados, selecione Sim, cancelar.
Quando estiver no editor de pipeline, selecione Adicionar atividade de pipeline e, em seguida, selecione Fluxo de dados.
Nota
Você também pode selecionar Fluxo de dados na faixa de opções.
Selecione a atividade de fluxo de dados no editor de pipeline e altere seu valor Name para OnlineSalesActivity na seção Geral.
Com a atividade de fluxo de dados ainda selecionada, selecione Configurações e escolha OnlineSalesDataflow na lista Fluxo de dados. Se necessário para atualizar a lista, selecione o ícone Atualizar .
Selecione a guia Atividades e, em seguida, a atividade do Office365 Outlook .
Nota
Se aparecer uma janela Conceder consentimento , selecione Ok, inicie sessão com a sua conta organizacional e, em seguida, selecione Permitir acesso.
Selecione a atividade do Office365 Outlook no editor de pipeline e altere seu valor Nome para Email em caso de falha na seção Geral.
Com a atividade do Office 365 Outlook ainda selecionada, selecione Configurações. Atualize o campo Para para o seu endereço de e-mail e a falha Sujeito ao pipeline. Selecione Adicionar conteúdo dinâmico [Alt+Shift+D] para o Corpo do email.
Nota
Mais opções de configuração de e-mail, como De (Enviar como), Cc, Cco, Rótulo de sensibilidade e muito mais, estão disponíveis nas propriedades Avançadas.
No construtor de expressões Pipeline, cole o seguinte bloco de código de expressão:
@concat( 'Pipeline: ' , , '<br>' , 'Workspace: ' , , '<br>' , 'Time: ' , )
Selecione Variáveis do sistema e insira as seguintes variáveis selecionando o nome correspondente na tabela a seguir.
Nome do valor Line Variável de sistema Gasoduto: 3 Pipeline ID Espaço de trabalho: 6 ID da área de trabalho Selecione Funções e insira a seguinte função selecionando o nome correspondente na tabela a seguir. Uma vez concluído, selecione OK.
Nome do valor Line Variável de sistema Hora: 9 UTCnow Selecione OnlineSalesActivity. Nas opções de caminho disponíveis, selecione o "X" (On fail). Isso cria uma seta que é solta na atividade Mail on failure . Essa atividade agora é invocada se o OnlineSalesActivity falhar.
Na guia Página Inicial, selecione Agendar. Depois de atualizar as configurações a seguir, selecione Aplicar para salvar as alterações.
Nome Valor Execução programada Ativado Repeat Diárias Hora 12:00:00 Na guia Página Inicial, selecione Executar. Se uma janela de diálogo for exibida, selecione a opção Salvar e executar para continuar.
Para monitorar o status atual do pipeline, você pode exibir a tabela Saída , que exibe o progresso da atividade atual. A tabela é atualizada periodicamente por conta própria ou você pode selecionar manualmente o ícone de atualização para atualizá-la.
Quando o status retornar Bem-sucedido, você poderá prosseguir para a próxima seção do tutorial retornando ao seu espaço de trabalho.
Criar um modelo semântico no Lakehouse
Os dados carregados estão quase prontos para relatórios. Vamos primeiro usar o ponto de extremidade SQL para criar relacionamentos e exibições SQL em nosso lakehouse. Isso nos permite acessar facilmente nossos dados dentro de um modelo semântico, que é um modelo de metadados que contém objetos de banco de dados físicos que são abstraídos e modificados em dimensões lógicas. Ele é projetado para apresentar dados para análise de acordo com a estrutura do negócio.
Criar relações
Este modelo é um esquema em estrela que você pode ver em armazéns de dados: ele se assemelha a uma estrela. O centro da estrela é uma tabela de fatos. As tabelas ao redor são chamadas de tabelas de dimensão, que estão relacionadas à tabela de fatos com relações.
Na exibição do espaço de trabalho, selecione o item SQL Endpoint chamado SalesLakehouse.
Uma vez no Explorer, selecione a visualização Modelo na parte inferior da tela para começar a criar relações.
Crie uma relação arrastando e soltando a coluna CustomerKey da tabela FactOnlineSales para a CustomerKey na tabela DimCustomer .
Uma vez na janela Criar relacionamento , certifique-se de selecionar as tabelas, colunas e configurações corretas, conforme mostrado na tabela a seguir. Selecione Confirmar para continuar.
Tornar esta relação ativa De: Tabela 1 (coluna) Para: Tabela 2 (coluna) Cardinalidade Direção do filtro cruzado ☑ FactOnlineSales (CustomerKey) DimCustomer (CustomerKey) Muitos para um (*:1) Única Execute essas mesmas etapas para cada uma das tabelas e colunas restantes listadas na tabela a seguir para criar relações.
Tornar esta relação ativa De: Tabela 1 (coluna) Para: Tabela 2 (coluna) Cardinalidade Direção do filtro cruzado ☑ FactOnlineSales (ProductKey) DimProduct (ProductKey) Muitos para um (*:1) Única ☑ FactOnlineSales (StoreKey) DimStore (StoreKey) Muitos para um (*:1) Única ☑ FactOnlineSales (DateKey) DimDate (DateKey) Muitos para um (*:1) Única ☑ DimStore (StoreKey) DimEmployee (StoreKey) Muitos para um (*:1) Ambos A imagem a seguir mostra uma visão concluída do modelo semântico com todas as relações criadas incluídas.
Escrever uma medida no DAX
Vamos escrever uma medida básica que calcula o valor total das vendas.
Selecione a tabela FactOnlineSales na pasta Tabelas . Na guia Página Inicial, selecione Nova medida.
No editor de fórmulas, copie e cole ou digite a seguinte medida para calcular o valor total das vendas. Selecione a marca de seleção para confirmar.
Total Sales Amount = SUM(FactOnlineSales[SalesAmount])
Criar uma vista SQL
Vamos escrever uma instrução SQL que calcula o valor total de vendas por mês. Em seguida, salvaremos esta declaração como uma vista em nossa casa do lago. Isso nos permite acessar facilmente o valor total de vendas por mês no futuro.
Na guia Página Inicial, selecione Nova consulta SQL.
No editor de consultas, copie e cole ou digite esta consulta para calcular o valor total de vendas por número de mês em ordem decrescente. Depois de inserido, selecione Executar para visualizar os resultados.
SELECT MONTH(DateKey) as "MonthNumber", SUM(SalesAmount) as "TotalSalesAmount" FROM FactOnlineSales GROUP BY MONTH(DateKey)
Realce o texto completo da consulta e selecione Salvar como exibição.
Na janela Salvar como exibição, defina o nome da exibição como TotalSalesByMonth e selecione OK.
No Explorer, expanda a seção Modos de exibição e selecione TotalSalesByMonth para exibir os resultados na visualização de dados.
Quando terminar de explorar o editor de ponto de extremidade SQL, você poderá prosseguir para a próxima seção do tutorial retornando ao seu espaço de trabalho.
Criar automaticamente um relatório
Agora que você modelou seus dados, é hora de visualizar e explorar seus dados usando a criação rápida.
Na visualização do espaço de trabalho, passe o mouse sobre o tipo de item Dataset (padrão) e o nome do item SalesLakehouse. Selecione as reticências ( ... ) e escolha Criar relatório automaticamente.
Um relatório é gerado automaticamente para você e atualizado dinamicamente com base nas seleções de colunas no painel Seus dados .
- O relatório exibido pode ser diferente da imagem.
Selecione Salvar na faixa de opções para salvar uma cópia no espaço de trabalho atual
- Para inserir a experiência de criação visual completa, você pode selecionar Editar na faixa de opções.
Na caixa de diálogo Salvar relatório, digite Resumo de vendas no campo Digite um nome para o relatório . Selecione Salvar depois de concluído.
Você pode saber mais sobre a criação rápida.
Conteúdos relacionados
Parabéns por concluir o tutorial. Se você criou um espaço de trabalho para o tutorial, pode optar por excluí-lo agora. Como alternativa, você pode remover os itens individuais que foram criados durante o tutorial.
Esperamos que este tutorial tenha mostrado como os usuários do Power BI podem fornecer facilmente informações sobre dados em qualquer nível de escala com o Microsoft Fabric.