Příprava dat pomocí Databricks
Databricks poskytuje bohatou sadu funkcí přípravy dat, které zahrnují robustní prostředí pro spolupráci mezi datovými vědci, inženýry a analytiky. Středem jsou kanály, které ingestují a transformují data. Databricks nabízí Structured Streaming a Delta Live Tables, které umožňují snadné vytváření nejúčinnějších pipeline. Podívejte se na Streaming v Azure Databricks a co je Delta Live Tables?.
Přehled o tom, proč je nejlepší volbou pro datové kanály přírůstkové zpracování datových proudů poskytované strukturovaným streamováním a dynamickými tabulkami delta, najdete v tématu Proč přírůstkové zpracování datových proudů?.
Další prostředky přípravy dat
Databricks poskytuje funkce pro úlohy přípravy dat pro mnoho dalších scénářů:
- Poznámkové bloky Databricks jsou oblíbeným nástrojem pro spolupráci.
- Naplánujte a orchestrujte pracovní postupy pomocí úloh Databricks.
- Pokud vytváříte řešení strojového učení, podívejte se na Databricks Mosaic AI .
Poznámka:
Pokud primárně pracujete s dotazy SQL a nástroji BI, přečtěte si téma Databricks SQL.
Úvodní kurzy a úvodní informace najdete v tématu Začínáme s azure Databricks a Co je Azure Databricks?.
Název | Tuto možnost použijte, když chcete... |
---|---|
Delta Live Tables | Naučte se vytvářet datové kanály pro příjem a transformaci pomocí živých tabulek Databricks Delta. |
Strukturované streamování | Seznamte se se streamováním, přírůstkovými úlohami a úlohami v reálném čase využívajících strukturované streamování v Databricks. |