Introdução ao tutorial do armazém de dados
Aplica-se a:✅ ponto de extremidade de análise SQL e Warehouse no Microsoft Fabric
O Microsoft Fabric fornece um balcão único para todas as necessidades analíticas de cada empresa. Ele abrange todo o espectro de serviços, incluindo movimentação de dados, data lake, engenharia de dados, integração de dados e ciência de dados, análise em tempo real e business intelligence. Com o Microsoft Fabric, não há necessidade de unir diferentes serviços de vários fornecedores. Em vez disso, o cliente desfruta de um produto completo, altamente integrado, único e abrangente que é fácil de entender, integrar, criar e operar. Nenhum outro produto no mercado oferece a amplitude, profundidade e nível de integração que o Microsoft Fabric oferece. Além disso, o Microsoft Purview está incluído por padrão em todos os locatários para atender às necessidades de conformidade e governança.
Objetivo deste tutorial
Embora muitos conceitos no Microsoft Fabric possam ser familiares para profissionais de dados e análise, pode ser um desafio aplicar esses conceitos em um novo ambiente. Este tutorial foi projetado para percorrer passo a passo um cenário de ponta a ponta, desde a aquisição de dados até o consumo de dados, para criar uma compreensão básica da experiência do usuário do Microsoft Fabric, das várias experiências e seus pontos de integração e das experiências de desenvolvedor profissional e cidadão do Microsoft Fabric.
Os tutoriais não se destinam a ser uma arquitetura de referência, uma lista exaustiva de recursos e funcionalidades ou uma recomendação de práticas recomendadas específicas.
Cenário de ponta a ponta do data warehouse
Como pré-requisitos para este tutorial, conclua as seguintes etapas:
- Inicie sessão na sua conta do Power BI online ou, se ainda não tiver uma conta, inscreva-se para uma avaliação gratuita.
- Habilite o Microsoft Fabric em seu locatário.
Neste tutorial, você assume a função de desenvolvedor de armazém na empresa fictícia Wide World Importers e conclui as seguintes etapas no portal do Microsoft Fabric para criar e implementar uma solução completa de data warehouse:
- Crie um espaço de trabalho do Microsoft Fabric.
- Crie um armazém.
- Ingerir dados da origem para o modelo dimensional do armazém de dados com um pipeline de dados.
- Crie tabelas no seu Armazém.
- Carregue dados com T-SQL com o editor de consultas SQL.
- Clone uma tabela usando T-SQL com o editor de consultas SQL.
- Transforme os dados para criar conjuntos de dados agregados usando T-SQL.
- Viagem no tempo usando T-SQL para ver os dados como eles apareceram.
- Use o editor de consultas visual para consultar o data warehouse.
- Analise dados com um bloco de anotações.
- Crie e execute consultas entre armazéns com o editor de consultas SQL.
- Crie relatórios do Power BI usando o modo DirectLake para analisar os dados no local.
- Crie um relatório a partir do OneLake.
- Limpe os recursos excluindo o espaço de trabalho e outros itens.
Arquitetura de ponta a ponta do data warehouse
Fontes de dados - O Microsoft Fabric torna fácil e rápido conectar-se aos Serviços de Dados do Azure, outras plataformas de nuvem e fontes de dados locais para ingerir dados.
Ingestão - Com 200+ conectores nativos como parte do pipeline do Microsoft Fabric e com a transformação de dados de arrastar e soltar com fluxo de dados, você pode criar rapidamente insights para sua organização. O atalho é um novo recurso do Microsoft Fabric que fornece uma maneira de se conectar a dados existentes sem precisar copiá-los ou movê-los. Você pode encontrar mais detalhes sobre o recurso Atalho mais adiante neste tutorial.
Transformar e armazenar - O Microsoft Fabric padroniza no formato Delta Lake, o que significa que todos os mecanismos do Microsoft Fabric podem ler e trabalhar nos mesmos dados armazenados no OneLake - sem necessidade de duplicidade de dados. Esse armazenamento permite que você crie um data warehouse ou malha de dados com base em sua necessidade organizacional. Para transformação, você pode escolher uma experiência low-code ou no-code com pipelines/fluxos de dados ou usar T-SQL para uma experiência code first.
Consumir - Os dados do armazém podem ser consumidos pelo Power BI, a ferramenta de business intelligence líder do setor, para geração de relatórios e visualização. Cada armazém vem com um ponto de extremidade TDS integrado para se conectar facilmente e consultar dados de outras ferramentas de relatório, quando necessário. Quando um armazém é criado, um item secundário, chamado de modelo semântico padrão, é gerado ao mesmo tempo com o mesmo nome. Você pode usar o modelo semântico padrão para começar a visualizar dados com apenas algumas etapas.
Dados de exemplo
Para dados de exemplo, usamos o banco de dados de exemplo Wide World Importers (WWI). Para nosso cenário de armazém de dados de ponta a ponta, geramos dados suficientes para uma prévia dos recursos de escala e desempenho da plataforma Microsoft Fabric.
A Wide World Importers (WWI) é uma importadora e distribuidora de produtos de novidade por atacado que opera a partir da área da Baía de São Francisco. Como grossista, os clientes da Primeira Guerra Mundial são maioritariamente empresas que revendem a particulares. A Primeira Guerra Mundial vende para clientes de varejo nos Estados Unidos, incluindo lojas especializadas, supermercados, lojas de informática, lojas de atrações turísticas e alguns indivíduos. A WWI também vende a outros grossistas através de uma rede de agentes que promovem os produtos em nome da WWI. Para obter mais informações sobre o perfil e a operação da empresa, consulte Bancos de dados de exemplo da Wide World Importers para Microsoft SQL.
Normalmente, você traria dados de sistemas transacionais (ou aplicativos de linha de negócios) para um data lake ou área de preparação de data warehouse. No entanto, para este tutorial, usamos o modelo dimensional fornecido pela Primeira Guerra Mundial como nossa fonte de dados inicial. Usamo-lo como fonte para ingerir os dados num armazém de dados e transformá-los através de T-SQL.
Modelo de dados
Embora o modelo dimensional WWI contenha várias tabelas de fatos, para este tutorial, nos concentramos apenas na fact_sale
tabela e em suas dimensões relacionadas, da seguinte forma, para demonstrar esse cenário de data warehouse de ponta a ponta: