Pipelines de implantação do Lakehouse e integração git (Preview)
O Lakehouse integra-se com os recursos de gerenciamento de ciclo de vida no Microsoft Fabric, fornecendo uma colaboração padronizada entre todos os membros da equipe de desenvolvimento ao longo da vida útil do produto. O gerenciamento do ciclo de vida facilita um processo eficaz de versionamento e lançamento de produtos, fornecendo continuamente recursos e correções de bugs em vários ambientes. Para saber mais, consulte O que é o gerenciamento do ciclo de vida no Microsoft Fabric?.
Importante
Este recurso está em pré-visualização.
Integração Lakehouse git
O Lakehouse é um item que contém metadados e dados referenciados em vários objetos no espaço de trabalho. Lakehouse contém tabelas, pastas e atalhos como itens de contêiner de dados gerenciáveis primários. Do ponto de vista do fluxo de trabalho de desenvolvimento, os seguintes objetos dependentes podem fazer referência a um Lakehouse:
- Fluxos de dados e pipelines de dados
- Definições de trabalho do Spark
- Notebooks
- Modelos semânticos e Power BI
O modelo semântico padrão e os metadados do ponto de extremidade da análise SQL estão relacionados a um Lakehouse e são gerenciados pelo processo de atualização do git por padrão. Como os dados de princípio não são rastreados no git, apenas os metadados são rastreados.
Representação Git
As seguintes informações do lakehouse são serializadas e rastreadas em um espaço de trabalho conectado ao git:
- Display name
- Descrição
- GUID lógico
Nota
O guid lógico rastreado é um identificador de espaço de trabalho cruzado gerado automaticamente que representa um item e sua representação de controle do código-fonte.
Importante
Apenas o artefato de contêiner Lakehouse é rastreado no git na experiência atual. Tabelas, pastas, atalhos e outras alterações de metadados não são controladas e versionadas no git.
Recursos de integração do Lakehouse git
Os seguintes recursos estão disponíveis:
- Serialização dos metadados do objeto Lakehouse para uma representação JSON git.
- Aplique as alterações diretamente ou use a solicitação pull para controlar as alterações em espaços de trabalho e ramificações upstream ou downstream.
- Renomear casas de lago são rastreadas no git. A atualização de um lakehouse renomeado também renomeia o modelo de dados semânticos padrão e o ponto de extremidade do SQL Analytics.
- Nenhuma ação é aplicada a tabelas, pastas e atalhos, metadados e os dados desses itens são sempre preservados.
Lakehouse em gasodutos de implantação
O Lakehouse é suportado nos pipelines de implantação do gerenciamento do ciclo de vida do Microsoft Fabric. Ele permite práticas recomendadas de segmentação de ambiente.
Recursos de integração de pipelines de implantação Lakehouse:
Implantação em espaços de trabalho de desenvolvimento, teste e produção.
Lakehouse pode ser removido como um objeto dependente após a implantação. O mapeamento de diferentes Lakehouses dentro do contexto do pipeline de implantação também é suportado.
Se nada for especificado durante a configuração do pipeline de implantação, um novo objeto Lakehouse vazio com o mesmo nome será criado no espaço de trabalho de destino. As definições de trabalho do bloco de anotações e do Spark são remapeadas para fazer referência ao novo objeto Lakehouse no novo espaço de trabalho.
Se a dependência do Lakehouse estiver configurada para fazer referência a um Lakehouse diferente durante o tempo de configuração do pipeline de implantação, como o Lakehouse upstream, um novo objeto vazio do Lakehouse com o mesmo nome ainda será criado no espaço de trabalho de destino, mas as referências de Notebooks e Definições de Trabalho do Spark serão preservadas para um Lakehouse diferente, conforme solicitado.
Os pontos de extremidade e os modelos semânticos do SQL Analytics são provisionados como parte da implantação do Lakehouse.
Nenhum objeto dentro da Lakehouse é substituído.
As atualizações para o nome do Lakehouse podem ser sincronizadas entre espaços de trabalho em um contexto de pipeline de implantação.