Tutorial: Configurar bancos de dados espelhados do Microsoft Fabric a partir do Azure Databricks (Visualização)
O espelhamento de banco de dados no Microsoft Fabric é uma tecnologia SaaS, baseada em nuvem e de ETL zero. Este guia ajuda você a estabelecer um banco de dados espelhado do Azure Databricks, que cria uma cópia somente leitura e replicada continuamente de seus dados do Azure Databricks no OneLake.
Pré-requisitos
- Crie ou use um espaço de trabalho existente do Azure Databricks com o Unity Catalog habilitado.
- Você deve ter o
EXTERNAL USE SCHEMA
privilégio no esquema no Unity Catalog que contém as tabelas que serão acessadas a partir do Fabric. Para obter mais informações, consulte Controlar o acesso externo aos dados no Unity Catalog. - Ative a configuração de locatário "Catálogo de Databricks do Azure espelhado (Visualização)" no nível de locatário ou capacidade para esse recurso.
- Você precisa usar o modelo de permissões do Fabric para definir controles de acesso para catálogos, esquemas e tabelas no Fabric.
- Os espaços de trabalho do Azure Databricks não devem estar atrás de um ponto de extremidade privado.
- As contas de armazenamento que contêm dados do Catálogo Unity não podem estar protegidas por um firewall.
Criar um banco de dados espelhado a partir do Azure Databricks
Siga estas etapas para criar um novo banco de dados espelhado do seu Catálogo Unity do Azure Databricks.
Navegar para https://powerbi.com.
Selecione + Novo e, em seguida, Catálogo espelhado do Azure Databricks.
Selecione uma conexão existente se tiver uma configurada.
- Se você não tiver uma conexão existente, crie uma nova conexão e insira todos os detalhes. Você pode autenticar em seu espaço de trabalho do Azure Databricks usando 'Conta organizacional' ou "Entidade de serviço". Para criar uma conexão, você deve ser um usuário ou um administrador do espaço de trabalho do Azure Databricks.
Depois de se conectar a um espaço de trabalho do Azure Databricks, na página Escolher tabelas de um catálogo do Databricks, você poderá selecionar o catálogo, esquemas e tabelas por meio da lista de inclusão/exclusão que deseja adicionar e acessar do Microsoft Fabric. Escolha o catálogo e seus esquemas e tabelas relacionados que você deseja adicionar ao seu espaço de trabalho do Fabric.
- Você só pode ver os catálogos/esquemas/tabelas aos quais você tem acesso de acordo com os privilégios concedidos a eles de acordo com o modelo de privilégios descrito em Privilégios do Catálogo Unity e objetos protegíveis.
- Por padrão, a opção Sincronizar automaticamente futuras alterações de catálogo para o esquema selecionado está habilitada. Para obter mais informações, consulte Espelhando o Catálogo Unity do Azure Databricks (Visualização).
- Quando tiver feito as suas seleções, selecione Seguinte.
Por padrão, o nome do item será o nome do catálogo que você está tentando adicionar ao Fabric. Na página Revisar e criar, você pode revisar os detalhes e, opcionalmente, alterar o nome do item de banco de dados espelhado, que deve ser exclusivo em seu espaço de trabalho. Selecione Criar.
Um item de catálogo Databricks é criado e, para cada tabela, um atalho de tipo Databricks correspondente também é criado.
- Os esquemas que não têm tabelas não serão mostrados.
Você também pode ver uma visualização dos dados ao acessar um atalho selecionando o ponto de extremidade de análise SQL. Abra o item de ponto de extremidade da análise SQL para iniciar a página do Explorer e do editor de consultas. Você pode consultar suas tabelas espelhadas do Azure Databricks com T-SQL no Editor SQL.
Criar atalhos do Lakehouse para o item de catálogo Databricks
Você também pode criar atalhos do Lakehouse para o item do catálogo Databricks para usar os dados do Lakehouse e usar os Blocos de Anotações do Spark.
- Primeiro, criamos uma casa no lago. Se você já tem uma lakehouse neste espaço de trabalho, você pode usar uma lakehouse existente.
- Selecione seu espaço de trabalho no menu de navegação.
- Selecione + New>Lakehouse.
- Forneça um nome para sua casa do lago no campo Nome e selecione Criar.
- Na vista Explorer da sua casa do lago, no menu Obter dados na sua casa do lago, em Carregar dados na sua casa do lago, selecione o botão Novo atalho.
- Selecione Microsoft OneLake. Selecione um catálogo. Este é o item de dados que você criou nas etapas anteriores. Em seguida, selecione Seguinte.
- Selecione tabelas dentro do esquema e selecione Avançar.
- Selecione Criar.
- Os atalhos agora estão disponíveis em sua Lakehouse para usar com seus outros dados da Lakehouse. Você também pode usar o Notebooks e o Spark para executar o processamento de dados nos dados dessas tabelas de catálogo que você adicionou do seu espaço de trabalho do Azure Databricks.
Criar um modelo semântico
Gorjeta
Para obter a melhor experiência, é recomendável usar o Microsoft Edge Browser para tarefas de modelagem semântica.
Saiba mais sobre o modelo semântico padrão do Power BI.
Além do modelo semântico padrão do Power BI, você tem a opção de atualizar o modelo semântico padrão do Power BI se optar por adicionar/remover tabelas do modelo ou criar um novo Modelo Semântico. Para atualizar o modelo semântico padrão:
- Navegue até o item Mirrored Azure Databricks em seu espaço de trabalho.
- Selecione o ponto de extremidade da análise SQL na lista suspensa na barra de ferramentas.
- Em Relatórios, selecione Gerenciar modelo semântico padrão.
Gerenciar suas relações de modelo semântico
- Selecione Layouts de modelo no Explorer em seu espaço de trabalho.
- Depois que os layouts de modelo são selecionados, você é apresentado a um gráfico das tabelas que foram incluídas como parte do Modelo semântico.
- Para criar relações entre tabelas, arraste um nome de coluna de uma tabela para outro nome de coluna de outra tabela. Um pop-up é apresentado para identificar a relação e cardinalidade para as tabelas.