Ingeniería de datos con Databricks
Databricks proporciona un amplio conjunto de características de ingeniería de datos que incluyen un entorno sólido para la colaboración entre científicos de datos, ingenieros y analistas. A través del centro de ella se encuentran las canalizaciones que ingieren y transforman los datos. Para habilitar la ingeniería sencilla de las canalizaciones más eficaces, Databricks ofrece Structured Streaming y Delta Live Tables. Consulte Streaming en Azure Databricks y ¿Qué es Delta Live Tables?.
Para obtener información general sobre por qué el procesamiento incremental de flujos de datos proporcionados por Structured Streaming y Delta Live Tables es la mejor opción para las canalizaciones de datos, consulte ¿Por qué el procesamiento incremental de flujos?.
Recursos adicionales de ingeniería de datos
Databricks proporciona características para tareas de ingeniería de datos para muchos escenarios adicionales:
- Los cuadernos de Databricks son una herramienta popular para la colaboración.
- Programe y organice los flujos de trabajo mediante trabajos de Databricks.
- Consulte Databricks Mosaic AI si está diseñando soluciones de aprendizaje automático.
Nota:
Si trabaja principalmente con consultas SQL y herramientas de BI, consulte Databricks SQL.
Para obtener tutoriales de introducción e información introductoria, consulte Introducción a Azure Databricks y ¿Qué es Azure Databricks?.
Nombre | Use esta herramienta cuando quiera... |
---|---|
Delta Live Tables | Aprender a crear canalizaciones de datos para la ingesta y transformación con Databricks Delta Live Tables. |
Structured Streaming | Obtener información sobre el streaming, las cargas de trabajo incrementales y en tiempo real con tecnología de Structured Streaming en Databricks. |