LIVE-Schema (Legacy)
Dieser Artikel enthält eine Übersicht über die ältere Syntax und das Verhalten für das virtuelle LIVE
Schema.
Das LIVE
virtuelle Schema ist ein Legacyfeature von Delta Live Tables-Pipelines und gilt als veraltet. Sie können weiterhin den Legacyveröffentlichungsmodus und das LIVE
virtuelle Schema für Pipelines verwenden, die mit diesem Modus erstellt wurden. Databricks empfiehlt, alle Pipelines in den neuen Veröffentlichungsmodus zu migrieren. Die Unterstützung für ältere LIVE
virtuellen Schemas und den Legacy-Veröffentlichungsmodus wird in einer zukünftigen Version von Azure Databricks entfernt.
Anmerkung
Sie können die Pipelinekonfigurations-UI nicht verwenden, um neue Pipelines mit dem älteren Veröffentlichungsmodus zu erstellen. Wenn Sie neue Pipelines mit der älteren LIVE
-Syntax bereitstellen müssen, wenden Sie sich an Ihren Databricks-Kundenbetreuer.
Was ist das LIVE-virtuelle Schema?
Anmerkung
Das virtuelle Schema LIVE
wird nicht mehr benötigt, um die Datasetabhängigkeit im Standardveröffentlichungsmodus für Delta Live Tables zu analysieren.
Das LIVE
Schema ist ein Programmierkonzept in Delta Live Tables, das eine virtuelle Grenze für alle Datasets definiert, die in einer Pipeline erstellt oder aktualisiert wurden. Standardmäßig ist das LIVE
Schema nicht direkt an Datasets in einem veröffentlichten Schema gebunden. Stattdessen kann das LIVE
Schema die Logik in einer Pipeline planen und ausführen, auch wenn ein Benutzer Datasets nicht in einem Schema veröffentlichen möchte.
Im Legacy-Pipeline-Veröffentlichungsmodus können Sie das Schlüsselwort LIVE
verwenden, um auf andere Datasets in der aktuellen Pipeline zum Lesen zu verweisen, z. B. SELECT * FROM LIVE.bronze_table
. Im Standardveröffentlichungsmodus für neue Delta Live Tables-Pipelines wird diese Syntax im Hintergrund ignoriert, was bedeutet, dass nicht qualifizierte Bezeichner das aktuelle Schema verwenden. Siehe Festlegen des Zielkatalogs und des Schemas.
Legacyveröffentlichungsmodus für Pipelines
Das virtuelle Schema LIVE
wird mit dem veralteten Veröffentlichungsmodus der Delta Live Tables-Pipeline verwendet. Alle Tabellen, die vor dem 5. Februar 2025 erstellt wurden, verwenden standardmäßig den Legacyveröffentlichungsmodus.
In der folgenden Tabelle wird das Verhalten für alle materialisierten Ansichten und Streamingtabellen beschrieben, die in einer Pipeline im Legacy-Veröffentlichungsmodus erstellt oder aktualisiert wurden:
Speicheroption | Speicherort oder Katalog | Zielschema | Benehmen |
---|---|---|---|
Hive-Metastore | Keine Angabe | Keine Angabe | Dataset-Metadaten und -daten werden im DBFS-Root gespeichert. Für den Hive-Metaspeicher sind keine Datenbankobjekte registriert. |
Hive-Metastore | Ein URI oder Dateipfad zum Cloudobjektspeicher. | Keine Angabe | Datasetmetadaten und -daten werden am angegebenen Speicherort gespeichert. Für den Hive-Metaspeicher sind keine Datenbankobjekte registriert. |
Hive-Metastore | Keine Angabe | Ein vorhandenes oder neues Schema im Hive-Metaspeicher. | Datasetmetadaten und -daten werden im DBFS-Stamm gespeichert. Alle materialisierten Sichten und Streamingtabellen in der Pipeline werden im angegebenen Schema im Hive-Metastore veröffentlicht. |
Hive-Metastore | Ein URI oder Dateipfad zum Cloudobjektspeicher. | Ein vorhandenes oder neues Schema im Hive-Metaspeicher. | Datasetmetadaten und -daten werden am angegebenen Speicherort gespeichert. Alle materialisierten Sichten und Streamingtabellen in der Pipeline werden im angegebenen Schema im Hive-Metastore veröffentlicht. |
Unity-Katalog | Ein vorhandener Unity Catalog-Katalog. | Keine Angabe | Datasetmetadaten und -daten werden am Standardspeicherort gespeichert, der dem Zielkatalog zugeordnet ist. Im Unity-Katalog sind keine Datenbankobjekte registriert. |
Unity-Katalog | Ein vorhandener Unity Catalog-Katalog. | Ein vorhandenes oder neues Schema im Unity-Katalog. | Datasetmetadaten und -daten werden am Standardspeicherort gespeichert, der dem Zielschema oder Katalog zugeordnet ist. Alle materialisierten Sichten und Streamingtabellen in der Pipeline werden im angegebenen Schema in Unity Catalog veröffentlicht. |
Wechseln zwischen Veröffentlichungsmodi
Pipelines, die im Legacy-Veröffentlichungsmodus erstellt wurden, können sich für den neuen Standardveröffentlichungsmodus anmelden, indem die JSON-Konfiguration für die Pipeline aktualisiert wird. Sie können Pipelines nach aktivierung des neuen Standardverhaltens bei Bedarf in den Legacy-Veröffentlichungsmodus zurücksetzen.
Eigentum | Benehmen |
---|---|
target |
Konfiguriert die Pipeline für die Verwendung des herkömmlichen Veröffentlichungsmodus. Geben Sie den Namen des Zielschemas als Zeichenfolge an. |
schema |
Konfiguriert die Pipeline für die Verwendung des standardmäßigen Veröffentlichungsmodus, der das Aktualisieren materialisierter Ansichten und Streamingtabellen in mehreren Schemas unterstützt. Geben Sie den Namen des Standardschemas als Zeichenfolge an. |
Weitere Informationen finden Sie unter Delta Live Tables-Eigenschaftenreferenz.
Anmerkung
Sie müssen die Eigenschaften catalog
oder storage
, die jeweils von Unity Catalog- und Hive-Metastore-Pipelines verwendet werden, nicht aktualisieren.
Aktualisieren des Quellcodes aus dem LIVE-Schema
Pipelines, die für die Ausführung mit dem neuen Standardveröffentlichungsmodus konfiguriert sind, ignorieren die LIVE
Schemasyntax automatisch. Standardmäßig verwenden alle Tabellenlese den Katalog und das Schema, das in der Pipelinekonfiguration angegeben ist.
Für die meisten vorhandenen Pipelines hat diese Verhaltensänderung keine Auswirkungen, da das Legacy-LIVE
-Verhalten des virtuellen Schemas ebenso Lesevorgänge an den im Pipeline-Konfiguration angegebenen Katalog und das Schema weiterleitet.
Wichtig
Legacy-Code mit Leseoperationen, die den Standardkatalog und das Schema des Arbeitsbereichs nutzen, erfordern Aktualisierungen des Codes. Betrachten Sie die folgende materialisierte Ansichtsdefinition:
CREATE MATERIALIZED VIEW silver_table
AS SELECT * FROM raw_data
Im Legacyveröffentlichungsmodus verwendet ein nicht qualifizierter Lesevorgang aus der raw_data
-Tabelle den Standardkatalog und das Standardschema des Arbeitsbereichs, z. B. main.default.raw_data
. Im neuen Standardpipelinemodus sind der standardmäßig verwendete Katalog und das Schema in der Pipelinekonfiguration festgelegt. Um sicherzustellen, dass dieser Code wie erwartet funktioniert, aktualisieren Sie den Verweis so, dass er den vollqualifizierten Bezeichner für die Tabelle verwendet, wie im folgenden Beispiel:
CREATE MATERIALIZED VIEW silver_table
AS SELECT * FROM main.default.raw_data