Data Engineering mit Databricks
Databricks bietet eine umfangreiche Sammlung von Datentechnikfeatures, die eine robuste Umgebung für die Zusammenarbeit zwischen Datenwissenschaftlern, Ingenieuren und Analysten enthalten. Durch die Mitte davon sind die Pipelines, die die Daten aufnehmen und transformieren . Um ein einfaches Engineering der effizientesten Pipelines zu ermöglichen, bietet Databricks strukturierte Streaming- und Delta Live-Tabellen an. Siehe Streaming auf Azure Databricks und was ist Delta Live Tables?.
Eine Übersicht darüber, warum die inkrementelle Datenstromverarbeitung von Daten, die von strukturierten Streaming- und Delta Live-Tabellen bereitgestellt werden, die beste Option für Datenpipelinen ist, finden Sie unter Warum inkrementelle Datenstromverarbeitung?.
Zusätzliche Datentechnikressourcen
Databricks bietet Features für Datentechnikaufgaben für viele zusätzliche Szenarien:
- Databricks-Notizbücher sind ein beliebtes Tool für die Zusammenarbeit.
- Planen und koordinieren Sie Ihre Workflows mithilfe von Databricks-Aufträgen.
- Sehen Sie sich Databricks Mosaik AI an , wenn Sie Machine Learning-Lösungen entwerfen.
Hinweis
Wenn Sie in erster Linie mit SQL-Abfragen und BI-Tools arbeiten, lesen Sie Databricks SQL.
Lernprogramme und Einführungsanleitungen finden Sie unter "Erste Schritte mit Azure Databricks " und "Was ist Azure Databricks?".
Name | Verwenden Sie dies, wenn Sie möchten … |
---|---|
Delta Live Tables | Erfahren Sie, wie Sie Datenpipelines für die Erfassung und Transformation mit Databricks Delta Live Tables erstellen. |
Strukturiertes Streaming | Erfahren Sie mehr über Streaming-, inkrementelle und Echtzeitworkloads, die durch strukturiertes Streaming in Databricks unterstützt werden. |