Compartilhar via


Engenharia de dados com Databricks

O Databricks fornece um rico conjunto de recursos de engenharia de dados que incluem um ambiente robusto para colaboração entre cientistas de dados, engenheiros e analistas. Pelo centro dele passam os pipelines que ingerem e transformam os dados. Para permitir a engenharia fácil dos pipelines mais eficientes, a Databricks oferece Streaming Estruturado e DLT. Consulte Streaming no Azure Databricks e O que é DLT?.

Para obter uma visão geral de por que o processamento de fluxo incremental de dados fornecidos pelo Structured Streaming e DLT é a melhor opção para pipelines de dados, consulte Como criar pipelines de dados simples, eficientes e de baixa latência.

Recursos adicionais de engenharia de dados

O Databricks fornece recursos para tarefas de engenharia de dados para muitos cenários adicionais:

  • os notebooks Databricks são uma ferramenta popular de colaboração.
  • Agende e orquestre seus fluxos de trabalho usando Databricks Jobs.
  • Consulte o Mosaic AI do Databricks caso esteja a arquitetar soluções de aprendizado de máquina.

Observação

Se você trabalha principalmente com consultas SQL e ferramentas de BI, consulte Databricks SQL.

Para obter tutoriais de introdução e informações introdutórias, consulte Introdução ao Azure Databricks e O que é o Azure Databricks?.

Nome Use isso quando quiser...
DLT Saiba como criar pipelines de dados para ingestão e transformação com o Databricks DLT.
Streaming estruturado Saiba mais sobre cargas de trabalho de streaming, em tempo real e incrementais, impulsionadas pelo Structured Streaming no Databricks.