Condividi tramite


Ingegneria dei dati con Databricks

Databricks offre un set completo di funzionalità di ingegneria dei dati che includono un ambiente affidabile per la collaborazione tra data scientist, ingegneri e analisti. Attraverso il centro sono le pipeline che inseriscono e trasformano i dati. Per semplificare la progettazione delle pipeline più efficienti, Databricks offre Structured Streaming e Tabelle Live Delta. Vedere Streaming in Azure Databricks e Informazioni sulle tabelle live Delta.

Per una panoramica del motivo per cui l'elaborazione incrementale dei dati forniti da Structured Streaming e Delta Live Tables è l'opzione migliore per le pipeline di dati, vedere Perché l'elaborazione incrementale del flusso?.

Risorse aggiuntive di ingegneria dei dati

Databricks offre funzionalità per le attività di progettazione dei dati per molti scenari aggiuntivi:

  • I notebook di Databricks sono uno strumento molto diffuso per la collaborazione.
  • Pianificare e orchestrare i flussi di lavoro usando processi di Databricks.
  • Se si progettano soluzioni di Machine Learning, vedere l'intelligenza artificiale Mosaic di Databricks.

Nota

Se si lavora principalmente con query SQL e strumenti di business intelligence, vedere Databricks SQL.

Per esercitazioni introduttive e informazioni introduttive, vedere Introduzione ad Azure Databricks e Informazioni su Azure Databricks.

Nome Usare questa opzione quando si vuole:
Delta Live Tables Informazioni su come creare pipeline di dati per l'inserimento e la trasformazione con Delta Live Tables di Databricks.
Structured Streaming Informazioni sui carichi di lavoro in streaming, incrementali e in tempo reale con tecnologia Structured Streaming in Databricks.