Condividi tramite


Schema LIVE (obsoleto)

Questo articolo offre una panoramica della sintassi e del comportamento legacy per lo schema virtuale LIVE.

Lo LIVE schema virtuale è una funzionalità legacy delle pipeline di Delta Live Tables e viene considerata deprecata. È comunque possibile usare la modalità di pubblicazione legacy e lo schema virtuale LIVE per le pipeline create con questa modalità. Databricks consiglia di eseguire la migrazione di tutte le pipeline alla nuova modalità di pubblicazione. Il supporto per lo schema virtuale legacy LIVE e la modalità di pubblicazione legacy verranno rimossi in una versione futura di Azure Databricks.

Nota

Non è possibile usare l'interfaccia utente di configurazione della pipeline per creare nuove pipeline con la modalità di pubblicazione legacy. Se hai bisogno di implementare nuove pipeline utilizzando la sintassi legacy "LIVE", contatta il tuo rappresentante dell'account Databricks.

Che cos'è lo schema virtuale LIVE?

Nota

Lo schema virtuale LIVE non è più necessario per analizzare la dipendenza del set di dati nella modalità di pubblicazione predefinita per le tabelle Live Delta.

Lo schema LIVE è un concetto di programmazione nelle tabelle live Delta che definisce un limite virtuale per tutti i set di dati creati o aggiornati in una pipeline. Per impostazione predefinita, lo schema LIVE non è associato direttamente ai set di dati in uno schema pubblicato. Lo schema LIVE consente invece di pianificare ed eseguire la logica in una pipeline anche se un utente non vuole pubblicare set di dati in uno schema.

Nella modalità di pubblicazione della pipeline legacy è possibile usare la parola chiave LIVE per fare riferimento ad altri set di dati nella pipeline corrente per le letture, ad esempio SELECT * FROM LIVE.bronze_table. Nella modalità di pubblicazione predefinita per le nuove pipeline di tabelle live Delta questa sintassi viene ignorata automaticamente, ovvero gli identificatori non qualificati usano lo schema corrente. Vedere Impostare il catalogo di destinazione e lo schema.

modalità di pubblicazione della pipeline legacy

Lo schema virtuale LIVE viene usato con la modalità di pubblicazione della pipeline Delta Live Tables legacy. Per impostazione predefinita, tutte le tabelle create prima del 5 febbraio 2025 usano la modalità di pubblicazione legacy.

La tabella seguente descrive il comportamento per tutte le viste materializzate e le tabelle di streaming create o aggiornate in una pipeline in modalità di pubblicazione legacy:

Opzione di archiviazione Posizione o catalogo di archiviazione Schema di destinazione Comportamento
Metastore Hive Nessuno specificato Nessuno specificato I metadati e i dati del set di dati vengono archiviati nella radice DBFS. Nessun oggetto di database viene registrato nel metastore Hive.
Metastore Hive Un URI o un percorso di file per l'archiviazione di oggetti cloud. Nessuno specificato I metadati e i dati del set di dati vengono archiviati nella posizione di archiviazione specificata. Nessun oggetto di database viene registrato nel metastore Hive.
Metastore Hive Nessuno specificato Uno schema esistente o nuovo nel metastore Hive. I metadati e i dati del set di dati vengono archiviati nella radice DBFS. Tutte le viste materializzate e le tabelle di streaming nella pipeline vengono pubblicate nello schema specificato nel metastore Hive.
Metastore Hive Un URI o un percorso di file per l'archiviazione di oggetti cloud. Uno schema esistente o nuovo nel metastore Hive. I metadati e i dati del set di dati vengono archiviati nella posizione di archiviazione specificata. Tutte le viste materializzate e le tabelle di streaming nella pipeline vengono pubblicate nello schema specificato nel metastore Hive.
Catalogo Unity Catalogo Unity esistente. Nessuno specificato I metadati e i dati del set di dati vengono archiviati nella posizione di archiviazione predefinita associata al catalogo di destinazione. Nessun oggetto di database viene registrato nel catalogo Unity.
Catalogo Unity Un catalogo del Catalogo Unity esistente. Schema esistente o nuovo nel catalogo unity. I metadati e i dati del set di dati vengono archiviati nel percorso di archiviazione predefinito associato allo schema o al catalogo di destinazione. Tutte le viste materializzate e le tabelle di streaming nella pipeline vengono pubblicate nello schema specificato in Unity Catalog.

Passare da una modalità di pubblicazione all'altra

Le pipeline create in modalità di pubblicazione legacy possono acconsentire esplicitamente alla nuova modalità di pubblicazione predefinita aggiornando la configurazione JSON per la pipeline. È possibile ripristinare la modalità di pubblicazione legacy delle pipeline dopo aver abilitato il nuovo comportamento predefinito, se necessario.

Proprietà Comportamento
target Configura la pipeline per l'uso della modalità di pubblicazione legacy. Specificare il nome dello schema di destinazione come stringa.
schema Configura la pipeline per l'uso della modalità di pubblicazione predefinita, che supporta l'aggiornamento di viste materializzate e tabelle di streaming in più schemi. Specificare il nome dello schema predefinito come stringa.

Consultare informazioni di riferimento sulle proprietà delle Delta Live Tables.

Nota

Non è necessario aggiornare le proprietà catalog o storage usate rispettivamente dalle pipeline di Unity Catalog e Hive metastore.

Aggiornare il codice sorgente dallo schema LIVE

Le pipeline configurate per l'esecuzione con la nuova modalità di pubblicazione predefinita ignorano automaticamente la sintassi dello schema LIVE. Per impostazione predefinita, tutte le letture di tabella usano il catalogo e lo schema specificati nella configurazione della pipeline.

Per la maggior parte delle pipeline esistenti, questa modifica del comportamento non ha alcun impatto, poiché il comportamento legacy LIVE dello schema virtuale indirizza anche le letture al catalogo e allo schema specificati nella configurazione della pipeline.

Importante

Il codice legacy con letture che sfruttano il catalogo predefinito dell'area di lavoro e lo schema richiedono aggiornamenti del codice. Si consideri la definizione di vista materializzata seguente:

CREATE MATERIALIZED VIEW silver_table
AS SELECT * FROM raw_data

In modalità di pubblicazione legacy, una lettura non qualificata dalla tabella raw_data usa il catalogo e lo schema predefiniti dell'area di lavoro, ad esempio main.default.raw_data. Nella nuova modalità pipeline predefinita il catalogo e lo schema usati per impostazione predefinita sono quelli configurati nella configurazione della pipeline. Per assicurarsi che questo codice continui a funzionare come previsto, aggiornare il riferimento per usare l'identificatore completo per la tabella, come nell'esempio seguente:

CREATE MATERIALIZED VIEW silver_table
AS SELECT * FROM main.default.raw_data