Einführung
Delta Lake von der Linux Foundation ist eine Open-Source-Speicherebene für Spark, die relationale Datenbankfunktionen für Batch- und Streamingdaten ermöglicht. Mit Delta Lake können Sie eine Data Lakehouse-Architektur in Spark implementieren, um eine SQL-basierte Datenbearbeitungssemantik mit Unterstützung für Transaktionen und Schemaerzwingung zu unterstützen. Das Ergebnis ist ein Speicher für analytische Daten, der viele der Vorteile eines relationalen Datenbanksystems mit der Flexibilität der Speicherung von Datendateien in einem Data Lake verbindet.
In diesem Modul lernen Sie Folgendes:
- Beschreiben der wichtigsten Features und Möglichkeiten von Delta Lake
- Erstellen und Verwenden von Delta Lake-Tabellen in einem Synapse Analytics Spark-Pool
- Erstellen von Spark-Katalogtabellen für Delta Lake-Daten
- Verwenden von Delta Lake-Tabellen zum Streamen von Daten
- Abfragen von Delta Lake-Tabellen in einem Synapse Analytics-SQL-Pool
Hinweis
Die in einem Azure Synapse Analytics-Pool verfügbare Version von Delta Lake hängt von der in der Poolkonfiguration angegebenen Spark-Version ab. Die Informationen in diesem Modul beziehen sich auf die Delta Lake-Version 1.0, die mit Spark 3.1 installiert wird.