Explore o lago do Microsoft Fabric
Um lakehouse apresenta-se como um banco de dados e é construído em cima de um data lake usando tabelas de formato Delta. Lakehouses combinam os recursos analíticos baseados em SQL de um data warehouse relacional e a flexibilidade e escalabilidade de um data lake. Lakehouses armazena todos os formatos de dados e pode ser usado com várias ferramentas de análise e linguagens de programação. Como soluções baseadas em nuvem, as lakehouses podem ser dimensionadas automaticamente e fornecer alta disponibilidade e recuperação de desastres.
Alguns benefícios de uma casa no lago incluem:
- A Lakehouses usa mecanismos Spark e SQL para processar dados em grande escala e dar suporte a aprendizado de máquina ou análise de modelagem preditiva.
- Os dados do Lakehouse são organizados em um formato de esquema em leitura, o que significa que você define o esquema conforme necessário, em vez de ter um esquema predefinido.
- Lakehouses suportam transações ACID (Atomicidade, Consistência, Isolamento, Durabilidade) através de tabelas formatadas Delta Lake para consistência e integridade de dados.
- Lakehouses são um único local para engenheiros de dados, cientistas de dados e analistas de dados acessarem e usarem dados.
Um lakehouse é uma ótima opção se você quiser uma solução de análise escalável que mantenha a consistência dos dados. É importante avaliar seus requisitos específicos para determinar qual solução é a mais adequada.
Carregue dados em uma casa de lago
As lacustres de tecido são um elemento central para a sua solução de análise. Você pode seguir o processo ETL (Extract, Transform, Load) para ingerir e transformar dados antes de carregar para o lakehouse.
Você pode ingerir dados em muitos formatos comuns de várias fontes, incluindo arquivos locais, bancos de dados ou APIs. Você também pode criar atalhos de malha para dados em fontes externas, como o Azure Data Lake Store Gen2 ou o OneLake. Use o Lakehouse explorer para procurar arquivos, pastas, atalhos e tabelas e visualizar seu conteúdo na plataforma Fabric.
Os dados ingeridos podem ser transformados e, em seguida, carregados usando o Apache Spark com notebooks ou Dataflows Gen2. Use os pipelines do Data Factory para orquestrar suas diferentes atividades de ETL e colocar os dados preparados em sua casa do lago.
Nota
Os fluxos de dados Gen2 baseiam-se no Power Query - uma ferramenta familiar para analistas de dados que utilizam Excel ou Power BI que fornece representação visual de transformações como alternativa à programação tradicional.
Você pode usar sua casa do lago por muitas razões, incluindo:
- Analise usando SQL.
- Treine modelos de aprendizado de máquina.
- Execute análises em dados em tempo real.
- Desenvolver relatórios no Power BI.
Garanta uma casa no lago
O acesso ao Lakehouse é gerenciado por meio do espaço de trabalho ou do compartilhamento no nível do item. As funções de espaços de trabalho devem ser usadas para colaboradores porque essas funções concedem acesso a todos os itens dentro do espaço de trabalho. O compartilhamento no nível do item é melhor usado para conceder acesso para necessidades somente leitura, como análises ou desenvolvimento de relatórios do Power BI.
O Fabric lakehouses também oferece suporte a recursos de governança de dados, incluindo rótulos de sensibilidade, e pode ser estendido usando o Microsoft Purview com seu locatário do Fabric.
Nota
Para obter mais informações, consulte a documentação Segurança no Microsoft Fabric .