Compartilhar via


O que é o espelhamento no Fabric?

O espelhamento no Fabric é uma solução de baixo custo e baixa latência para reunir dados de vários sistemas em uma única plataforma de análise. Você pode replicar continuamente o seu patrimônio de dados existente diretamente no OneLake do Fabric a partir de uma variedade de bancos de dados do Azure e fontes de dados externas.

Com os dados mais atualizados em formato consultável no OneLake, agora você pode usar todos os diferentes serviços do Fabric, como execução de análises com Spark, execução de notebooks, engenharia de dados, visualização por meio de relatórios do Power BI e muito mais.

O espelhamento no Fabric permite aos usuários usar um produto altamente integrado de ponta a ponta e fácil de usar, projetado para simplificar suas necessidades de análise. Criado para abertura e colaboração entre a Microsoft e soluções de tecnologia capazes de ler o formato de tabela Delta Lake de código aberto, o Espelhamento é uma solução turnkey de baixo custo e baixa latência que permite criar uma réplica de seus dados no OneLake que pode ser usada para todas as suas necessidades analíticas.

Em seguida, é possível usar as tabelas Delta em qualquer local do Fabric, permitindo que os usuários acelerem o percurso até o Fabric.

Por que usar o espelhamento no Fabric?

Hoje, muitas organizações têm dados operacionais ou analíticos de missão crítica em silos.

Acessar e trabalhar com esses dados hoje requer pipelines complexos de ETL (Extract Transform Load), processos de negócios e silos de decisão, criando:

  • Acesso restrito e limitado a dados importantes e em constante mudança
  • Atrito entre pessoas, processos e tecnologia
  • Longos tempos de espera para criar pipelines de dados e processos para dados criticamente importantes
  • Sem liberdade para usar as ferramentas necessárias para analisar e compartilhar insights confortavelmente
  • Falta de uma base adequada para as pessoas compartilharem e colaborarem em dados
  • Não há formatos de dados abertos comuns para todos os cenários analíticos - BI, IA, Integração, Engenharia e até mesmo Aplicativos

O espelhamento no Fabric oferece uma experiência fácil para acelerar o tempo de obtenção de valor para insights e decisões e para eliminar silos de dados entre soluções de tecnologia.

  • Replicação quase em tempo real de dados e metadados em um data-lake de SaaS, com análise interna para BI e IA

A plataforma do Microsoft Fabric foi criada com base no SaaS (Software como serviço), que leva a simplicidade e a integração a um nível totalmente novo. Para saber mais sobre o Microsoft Fabric, consulte O que é o Microsoft Fabric?

O espelhamento cria três itens no espaço de trabalho do Fabric:

Além do Editor de Consultas SQL, há um amplo ecossistema de ferramentas, incluindo o SQL Server Management Studio (SSMS), a extensão mssql com Visual Studio Code e até mesmo o GitHub CopilotCopilot.

O compartilhamento permite a facilidade de controle e gerenciamento de acesso, para garantir que você possa controlar o acesso a informações confidenciais. O compartilhamento também permite a tomada de decisões seguras e democratizadas em toda a organização.

Tipos de espelhamento

O Fabric oferece três abordagens diferentes para trazer dados para o OneLake por meio do espelhamento.

  • Espelhamento de banco de dados – o espelhamento de banco de dados no Microsoft Fabric permite a replicação de bancos de dados e tabelas inteiros, permitindo que você reúna dados de vários sistemas em uma única plataforma de análise.
  • Espelhamento de metadados – o espelhamento de metadados no Fabric sincroniza metadados (como nomes de catálogo, esquemas e tabelas) em vez de mover fisicamente os dados. Esta abordagem aproveita os atalhos, garantindo que os dados permaneçam em sua fonte e sejam facilmente acessíveis no Fabric.
  • Espelhamento aberto – o espelhamento aberto no Fabric foi projetado para estender o espelhamento com base no formato de tabela do Delta Lake aberto. Essa funcionalidade permite que qualquer desenvolvedor escreva os dados de alteração do aplicativo diretamente em um item de banco de dados espelhado no Microsoft Fabric, com base na abordagem de espelhamento aberto e nas APIs públicas.

Atualmente, os seguintes bancos de dados externos estão disponíveis:

Plataforma Duplicação quase em tempo real Tipo de espelhamento Tutorial de ponta a ponta
Bancos de dados espelhados no Microsoft Fabric do Azure Cosmos DB (versão prévia) Sim Espelhamento de banco de dados Tutorial: Azure Cosmos DB
Limitações nos bancos de dados espelhados no Microsoft Fabric usando o Azure Databricks (versão prévia) Sim Espelhamento de metadados Tutorial: Azure Databricks
Bancos de dados espelhados do Microsoft Fabric do Banco de Dados SQL do Azure Sim Espelhamento de banco de dados Tutorial do Banco de Dados SQL do Azure
Bancos de dados espelhados do Microsoft Fabric da Instância Gerenciada de SQL do Azure (versão prévia) Sim Espelhamento de banco de dados Tutorial: Instância Gerenciada de SQL do Azure
Bancos de dados espelhado do Microsoft Fabric do Snowflake Sim Espelhamento de banco de dados Tutorial: Snowflake
Abrir bancos de dados espelhados (versão prévia) Sim Abrir espelhamento Tutorial: Abrir espelhamento
Bancos de dados espelhados do Microsoft Fabric a partir de banco de dados SQL do Fabric(versão prévia) Sim Espelhamento de banco de dados Configurado automaticamente

Como a replicação quase em tempo real do espelhamento de banco de dados funciona?

O espelhamento é habilitado criando uma conexão segura com sua fonte de dados operacionais. Você escolhe se deseja duplicar um banco de dados inteiro ou tabelas individuais e o espelhamento manterá automaticamente seus dados sincronizados. Uma vez configurados, os dados serão duplicados continuamente no OneLake para consumo analítico.

Estes são os princípios básicos do espelhamento:

  • Habilitar o espelhamento no Fabric é simples e intuitivo, sem a necessidade de criar pipelines de ETL complexos, alocar outros recursos de computação e gerenciar a movimentação de dados.

  • O espelhamento no Fabric é um serviço totalmente gerenciado, portanto, você não precisa se preocupar com hospedagem, manutenção ou gerenciamento da duplicação da conexão espelhada.

Como funciona o espelhamento de metadados?

O espelhamento não só habilita a replicação de dados, mas também pode ser obtido por meio de atalhos ou espelhamento de metadados em vez de replicação completa de dados, permitindo que os dados fiquem disponíveis sem movê-los fisicamente ou duplicá-los. O espelhamento nesse contexto refere-se à replicação de apenas metadados, como nomes de catálogo, esquemas e tabelas, em vez dos próprios dados reais. Essa abordagem permite que o Fabric torne os dados de diferentes fontes acessíveis sem duplicá-los, simplificando o gerenciamento de dados e minimizando as necessidades de armazenamento.

Por exemplo, ao acessar dados registrados no Catálogo do Unity, o Fabric espelha apenas a estrutura de catálogo do Azure Databricks, permitindo que os dados subjacentes sejam acessados por meio de atalhos. Esse método garante que todas as alterações nos dados de origem sejam refletidas instantaneamente no Fabric sem a necessidade de movimentação de dados, mantendo a sincronização em tempo real e aumentando a eficiência no acesso a informações atualizadas.

Como funciona o espelhamento aberto?

Além de espelhar a habilitação da replicação de dados criando uma conexão segura com a sua fonte de dados, você também pode selecionar um provedor de dados existente ou escrever o seu próprio aplicativo para inserir dados no banco de dados espelhado. Depois de criar um banco de dados espelhado aberto por meio da API pública ou por meio do portal do Fabric, você poderá obter uma URL de zona de destino no OneLake, onde você poderá obter dados de alteração por especificação de espelhamento aberto.

Depois que os dados estiverem na zona de destino com o formato adequado, a replicação começará a ser executada e gerenciará a complexidade de mesclar as alterações com atualizações, inserções e exclusões a serem refletidas em tabelas Delta. Este método garante que todos os dados sejam gravados na zona de destino imediatamente e que os dados no Fabric permaneçam atualizados.

Compartilhamento

O compartilhamento permite a facilidade de controle e gerenciamento de acesso, enquanto controles de segurança como RLS (Segurança em nível de linha) e OLS (Segurança em nível de objeto) e muito mais garantem que você possa controlar o acesso a informações confidenciais. O compartilhamento também permite a tomada de decisões seguras e democratizadas em toda a organização.

Ao compartilhar, os usuários concedem a outros usuários ou a um grupo de usuários acesso a um lakehouse sem dar acesso ao espaço de trabalho e ao restante de seus itens. Quando alguém compartilha um banco de dados espelho, também concede acesso ao ponto de extremidade de análise do SQL e ao modelo semântico padrão associado.

Para obter mais informações, consulte Compartilhar seu banco de dados SQL e gerenciar permissões.

Consultas entre bancos de dados

Com os dados do banco de dados espelhado armazenados no OneLake, é possível gravar consultas entre bancos de dados, unindo dados de bancos de dados espelhados, depósitos e pontos de extremidade de análise SQL de Lakehouses em uma única consulta T-SQL. Para obter mais informações, consulte Gravar uma consulta entre bancos de dados.

Por exemplo, é possível fazer referência à tabela de bancos de dados espelhados e depósitos usando a nomeação de três partes. No exemplo a seguir, use o nome de três partes para se referir a ContosoSalesTable no depósito ContosoWarehouse adicionado. De outros bancos de dados ou armazéns, a primeira parte da convenção de nomenclatura de três partes SQL padrão é o nome do banco de dados espelhado.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Engenharia de dados com seus dados de banco de dados espelhados

O Microsoft Fabric fornece vários recursos de engenharia de dados para garantir que seus dados sejam facilmente acessíveis, bem organizados e tenham alta qualidade. Na Engenharia de Dados do Fabric, é possível:

  • Criar e gerenciar seus dados como Spark usando um lakehouse
  • Projetar pipelines para copiar dados para o lakehouse
  • Usar definições de trabalho do Spark para enviar trabalhos de lote/streaming para o cluster do Spark
  • Usar notebooks para gravar código para ingestão, preparação e transformação de dados

Ciência de dados com seus dados de banco de dados espelhados

O Microsoft Fabric oferece a experiência de Ciência de Dados para capacitar os usuários a concluir fluxos de trabalho de ciência de dados de ponta a ponta para fins de enriquecimento de dados e insights de negócios. Você pode concluir uma ampla gama de atividades em todo o processo de ciência de dados, desde exploração, preparação e limpeza de dados até experimentação, modelagem, pontuação de modelo e fornecimento de insights preditivos para relatórios do BI.

Os usuários do Microsoft Fabric podem acessar as cargas de trabalho de Ciência de Dados. A partir daí, eles podem descobrir e acessar vários recursos relevantes. Por exemplo, eles podem criar experimentos, modelos e notebooks de aprendizado de máquina. Eles também podem importar blocos de anotações existentes na página inicial da Ciência de Dados.

Banco de dados SQL no Fabric

Você também pode criar e gerenciar diretamente um banco de dados SQL no Microsoft Fabric (versão prévia) dentro do portal do Fabric. Com base no Banco de Dados SQL do Azure, o banco de dados SQL no Fabric é espelhado automaticamente para fins de análise e permite que você crie facilmente seu banco de dados operacional no Fabric. O banco de dados SQL é o local no Fabric onde se encontram as cargas de trabalho OLTP e pode ser integrado à integração do controle do código-fonte do Fabric.