Esquema LIVE (legado)
Este artigo fornece uma visão geral da sintaxe e do comportamento herdados para o esquema virtual LIVE
.
O esquema virtual LIVE
é um recurso legado dos pipelines Delta Live Tables e é considerado obsoleto. Você ainda pode usar o modo de publicação herdado e o esquema virtual LIVE
para pipelines que foram criados com esse modo. O Databricks recomenda migrar todos os pipelines para o novo modo de publicação. O suporte para o esquema virtual LIVE
legado e o modo de publicação legado será removido numa versão futura do Azure Databricks.
Observação
Não é possível usar a interface de configuração de pipeline para criar novos pipelines com o modo de publicação herdado. Se precisar implantar novos pipelines usando a sintaxe legada LIVE
, entre em contato com o seu representante de conta da Databricks.
O que é o esquema virtual LIVE?
Observação
O esquema virtual LIVE
não é mais necessário para analisar a dependência do conjunto de dados no modo de publicação padrão para Delta Live Tables.
O esquema LIVE
é um conceito de programação em Delta Live Tables que define um limite virtual para todos os conjuntos de dados criados ou atualizados em um pipeline. Por design, o esquema LIVE
não está vinculado diretamente a conjuntos de dados em um esquema publicado. Em vez disso, o esquema LIVE
permite que a lógica em um pipeline seja planejada e executada mesmo que um usuário não queira publicar conjuntos de dados em um esquema.
No modo de publicação do pipeline herdado, podes usar a palavra-chave LIVE
para referenciar outros conjuntos de dados no pipeline atual para leituras, por exemplo, SELECT * FROM LIVE.bronze_table
. No modo de publicação padrão para novos pipelines Delta Live Tables, essa sintaxe é ignorada silenciosamente, o que significa que identificadores não qualificados usam o esquema atual. Consulte Definir o catálogo de destino e o esquema.
Modo de publicação de pipeline herdado
O esquema virtual LIVE
é usado com o modo de publicação de legado do pipeline Delta Live Tables. Todas as tabelas criadas antes de 5 de fevereiro de 2025 usam o modo de publicação herdado por padrão.
A tabela seguinte descreve o comportamento de todas as vistas materializadas e tabelas de streaming criadas ou atualizadas num pipeline no modo de publicação legado:
Opção de armazenamento | Local de armazenamento ou catálogo | Esquema de destino | Comportamento |
---|---|---|---|
Metastore do Hive | Nenhum especificado | Nenhum especificado | Os metadados e dados do conjunto de dados são armazenados na raiz DBFS. Nenhum objeto de banco de dados é registrado no metastore do Hive. |
Metastore do Hive | Um URI ou caminho de arquivo para o armazenamento de objetos na nuvem. | Nenhum especificado | Os metadados e os dados do conjunto de dados são armazenados no local de armazenamento especificado. Nenhum objeto de banco de dados é registrado no metastore do Hive. |
Metastore do Hive | Nenhum especificado | Um esquema novo ou existente no metastore do Hive. | Os metadados e dados do conjunto de dados são armazenados na raiz DBFS. Todas as visualizações materializadas e tabelas de streaming no pipeline são publicadas no esquema especificado no metastore do Hive. |
Metastore do Hive | Um URI ou caminho de arquivo para o armazenamento de objetos na nuvem. | Um esquema existente ou novo no metastore do Hive. | Os metadados e os dados do conjunto de dados são armazenados no local de armazenamento especificado. Todas as visualizações materializadas e as tabelas de streaming no pipeline são publicadas no esquema especificado no Hive metastore. |
Catálogo Unity | Um catálogo Unity Catalog existente. | Nenhum especificado | Os metadados e os dados do conjunto de dados são armazenados no local de armazenamento padrão associado ao catálogo de destino. Nenhum objeto de banco de dados é registrado no Catálogo Unity. |
Catálogo Unity | Um catálogo Unity Catalog existente. | Um esquema existente ou novo no Unity Catalog. | Os metadados e os dados do conjunto de dados são armazenados no local de armazenamento padrão associado ao esquema ou catálogo de destino. Todas as visualizações materializadas e tabelas de streaming no pipeline são publicadas no esquema especificado no Unity Catalog. |
Alternar entre os modos de publicação
Os pipelines criados no modo de publicação herdado podem optar pelo novo modo de publicação padrão atualizando a configuração JSON para o pipeline. Você pode reverter pipelines para o modo de publicação herdado depois de habilitar o novo comportamento padrão, se necessário.
Propriedade | Comportamento |
---|---|
target |
Configura o pipeline para usar o modo de publicação herdado. Especifique o nome do esquema de destino como uma cadeia de caracteres. |
schema |
Configura o pipeline para usar o modo de publicação padrão, que oferece suporte à atualização de exibições materializadas e tabelas de streaming em vários esquemas. Especifique o nome do esquema padrão como uma cadeia de caracteres. |
Consulte Referência de propriedades do Delta Live Tables.
Observação
Não é necessário atualizar as propriedades catalog
ou storage
usadas respectivamente pelos pipelines de metastore do Unity Catalog e do Hive.
Atualizar código-fonte do esquema LIVE
Os pipelines configurados para serem executados com o novo modo de publicação padrão ignoram silenciosamente a sintaxe do esquema LIVE
. Por padrão, todas as leituras de tabela usam o catálogo e o esquema especificados na configuração do pipeline.
Para a maioria dos pipelines existentes, essa alteração de comportamento não tem impacto, pois o comportamento do esquema virtual LIVE
herdado também direciona leituras para o catálogo e o esquema especificados na configuração do pipeline.
Importante
O código herdado com leituras que aproveitam o catálogo e o esquema padrão do espaço de trabalho exigem atualizações de código. Considere a seguinte definição de visão materializada:
CREATE MATERIALIZED VIEW silver_table
AS SELECT * FROM raw_data
No modo de publicação herdado, uma leitura não qualificada da tabela raw_data
utiliza o catálogo e o esquema padrão do espaço de trabalho, como por exemplo main.default.raw_data
. No novo modo de pipeline padrão, o catálogo e o esquema usados por padrão são aqueles configurados na configuração do pipeline. Para garantir que esse código continue a funcionar conforme o esperado, atualize a referência para usar o identificador totalmente qualificado para a tabela, como no exemplo a seguir:
CREATE MATERIALIZED VIEW silver_table
AS SELECT * FROM main.default.raw_data