Compartir vía


¿Qué son las tablas y vistas?

Las tablas y vistas son conceptos fundamentales en Databricks para organizar y acceder a los datos.

Una tabla es un conjunto de datos estructurado almacenado en una ubicación específica, normalmente en formato Delta Lake. Las tablas almacenan datos reales en el almacenamiento y se pueden consultar y manipular mediante comandos SQL o API dataframe, operaciones auxiliares como insertar, actualizar, eliminar y combinar. Consulte ¿Qué es una tabla?.

Una vista es una tabla virtual definida por una consulta SQL. Una vista no almacena datos por sí mismo. En su lugar, una vista proporciona una manera de presentar datos de una o varias tablas en un formato o abstracción específicos. Las vistas son útiles para simplificar consultas complejas, encapsular la lógica de negocios y proporcionar una interfaz coherente a los datos subyacentes sin duplicar el almacenamiento. Vea ¿Qué es una vista?.

Tablas y vistas en el catálogo de Unity

Las tablas y vistas se rigen mediante el catálogo de Unity. En el catálogo de Unity, las tablas y las vistas se encuentran en el tercer nivel del espacio de nombres de tres niveles (catalog.schema.table), como se muestra en el diagrama siguiente.

Diagrama del modelo de objetos de Unity Catalog, centrado en la tabla

Diferencias entre tablas delta, tablas de streaming y vistas materializadas

En la tabla siguiente se responden las preguntas más frecuentes sobre las diferencias entre las tablas delta, las tablas de streaming y las vistas materializadas.

Pregunta Tabla delta ST MV
¿Qué es? Tablas estándar almacenadas en formato Delta Lake, que admiten transacciones ACID, aplicación de esquemas y otras características de Delta Lake. Tabla Delta normal que se ha ampliado para casos de uso de procesamiento incremental y de streaming. Resultado de una consulta cuyo resultado siempre se calcula previamente y es correcto.
¿Para qué casos de uso se recomienda? Código de procedimiento que hace lo siguiente:

-Ingestión
-Transformación
Código declarativo que hace lo siguiente:

- Ingesta de orígenes de solo anexión
- Transformaciones de baja latencia
Código declarativo que hace lo siguiente:

- Transformaciones incrementales
- Transformaciones por lotes
¿Cómo se rellena? Código de procedimientos (INSERT, UPDATE, MERGE, sobrescritura de particiones mediante replaceWhere) Código declarativo que incluye:

- Anexar secuencias
- APLICAR flujos DE CAMBIOS
- Una vez flujos
Consultas declarativas
¿Cuál es el tipo de objeto en el catálogo de Unity? Tabla Tabla Ver
¿Quién puede actualizarlo? Cualquier escritor que pueda actualizar una tabla Delta. Solo la canalización que define la tabla de streaming puede actualizarla. Solo la canalización que define la vista materializada puede actualizarla.
¿Con qué características de Delta Lake es compatible? Admite todas las características de Delta Lake. No admite:

- Creación de particiones líquidas
- Optimización predictiva
No admite:

- Creación de particiones líquidas
- Optimización predictiva