Lakehouse-Bereitstellungspipelines und Git-Integration (Vorschau)
Das Lakehouse kann in die Funktionen zur Lebenszyklusverwaltung in Microsoft Fabric integriert werden und ermöglicht so während der gesamten Lebensdauer des Produkts eine standardisierte Zusammenarbeit zwischen allen Mitgliedern des Entwicklungsteams. Die Lebenszyklusverwaltung ermöglicht durch die kontinuierliche Bereitstellung von Features und Fehlerbehebungen in mehreren Umgebungen einen effektiven Prozess für die Versionsverwaltung und Freigabe von Produkten. Weitere Informationen finden Sie unter Was ist die Lebenszyklusverwaltung in Microsoft Fabric?.
Wichtig
Dieses Feature befindet sich in der Vorschauphase.
Lakehouse-Git-Integration
Das Lakehouse ist ein Element, das sowohl Metadaten als auch Daten enthält, auf die in mehreren Objekten im Arbeitsbereich verwiesen wird. Ein Lakehouse enthält Tabellen, Ordner und Verknüpfungen als primäre verwaltbare Datencontainerelemente. Aus der Perspektive eines Entwicklungsworkflows können die folgenden abhängigen Objekte auf ein Lakehouse verweisen:
- Dataflows und Datenpipelines
- Spark-Auftragsdefinitionen
- Notebooks
- Semantische Modelle und Power BI
Die Standardmetadaten für semantische Modelle und SQL-Analyseendpunkte beziehen sich auf ein Lakehouse und werden standardmäßig vom Git-Aktualisierungsprozess verwaltet. Prinzipiell werden Daten nicht in Git nachverfolgt, sondern nur Metadaten.
Git-Darstellung
Die folgenden Lakehouse-Informationen werden serialisiert und in einem mit Git verbundenen Arbeitsbereich nachverfolgt:
- Anzeigename
- Beschreibung
- Logische GUID
Hinweis
Die nachverfolgte logische GUID ist ein automatisch generierter arbeitsbereichsübergreifender Bezeichner, der ein Element und seine Darstellung in der Quellcodeverwaltung darstellt.
Wichtig
Nur das Lakehouse-Containerartefakt wird in Git in der aktuellen Umgebung nachverfolgt. Änderungen an Tabellen, Ordnern, Verknüpfungen und anderen Metadaten werden in Git nicht nachverfolgt und nicht mit einer Versionsangabe versehen.
Git-Integrationsfunktionen für Lakehouses
Die folgenden Funktionen stehen zur Verfügung:
- Serialisierung der Lakehouse-Objektmetadaten in einer Git-JSON-Darstellung.
- Wenden Sie Änderungen direkt an, oder verwenden Sie Pull Requests, um Änderungen an Upstream- oder Downstream-Arbeitsbereichen und -Branches zu steuern.
- Die Umbenennung von Lakehouses wird in Git nachverfolgt. Durch das Aktualisieren eines umbenannten Lakehouse werden auch das standardmäßige semantische Datenmodell und der standardmäßige SQL-Analyseendpunkt umbenannt.
- Es wird keine Aktion auf Tabellen, Ordner und Verknüpfungen, Metadaten und Daten dieser Elemente angewendet.
Lakehouse in Bereitstellungspipelines
Das Lakehouse wird in Bereitstellungspipelines für die Microsoft Fabric-Lebenszyklusverwaltung unterstützt. Dies ermöglicht die Verwendung bewährter Methoden für die Segmentierung der Umgebung.
Integrationsfunktionen für Lakehouse-Bereitstellungspipelines:
Bereitstellung über Entwicklungs-, Test- und Produktionsarbeitsbereiche hinweg.
Lakehouse kann bei der Bereitstellung als abhängiges Objekt entfernt werden. Die Zuordnung verschiedener Lakehouses innerhalb des Kontexts der Bereitstellungspipeline wird ebenfalls unterstützt.
Wenn während der Konfiguration der Bereitstellungspipeline keine entsprechenden Angaben gemacht werden, wird ein neues Lakehouse-Objekt mit demselben Namen im Zielarbeitsbereich erstellt. Notebook- und Spark-Auftragsdefinitionen werden neu zugeordnet, um auf das neue Lakehouse-Objekt im neuen Arbeitsbereich zu verweisen.
Wenn die Lakehouse-Abhängigkeit so konfiguriert ist, dass sie während der Konfiguration der Bereitstellungspipeline auf ein anderes Lakehouse verweist (z. B. ein Upstream-Lakehouse), wird ein neues leeres Lakehouse-Objekt mit demselben Namen im Zielarbeitsbereich erstellt. Verweise auf Notebooks und Spark-Auftragsdefinitionen werden jedoch wie angefordert in einem anderen Lakehouse gespeichert.
SQL-Analyseendpunkte und semantische Modelle werden als Teil der Lakehouse-Bereitstellung bereitgestellt.
Es werden keine Objekte im Lakehouse überschrieben.
Aktualisierungen des Lakehouse-Namens können im Kontext einer Bereitstellungspipeline arbeitsbereichsübergreifend synchronisiert werden.