Compartir vía


Aplicación de esquemas

Azure Databricks valida la calidad de los datos aplicando el esquema en la escritura.

Nota

En este artículo se describe el comportamiento predeterminado de las tablas de Azure Databricks, respaldadas por Delta Lake. La aplicación del esquema no se aplica a las tablas respaldadas por datos externos.

Aplicación de esquema para operaciones de inserción

Azure Databricks aplica las reglas siguientes al insertar datos en una tabla:

  • Todas las columnas insertadas deben existir en la tabla de destino.
  • Todos los tipos de datos de columna deben coincidir con los tipos de datos de columna de la tabla de destino.

Nota

Azure Databricks intenta convertir de forma segura los tipos de datos de columna para que coincidan con la tabla de destino.

Validación del esquema durante las operaciones MERGE

Azure Databricks aplica las siguientes reglas al insertar o actualizar datos como parte de una operación de MERGE:

  • Si el tipo de datos de la instrucción de origen no coincide con la columna de destino, MERGE intenta convertir de forma segura los tipos de datos de columna para que coincidan con la tabla de destino.
  • Las columnas que son el destino de una acción UPDATE o INSERT deben existir en la tabla de destino.
  • Cuando se usa la sintaxis INSERT * o UPDATE SET *:
    • Se omiten las columnas del conjunto de datos de origen que no están presentes en la tabla de destino.
    • El conjunto de datos de origen debe tener todas las columnas presentes en la tabla de destino.

Modificación de un esquema de tabla

Puede actualizar el esquema de una tabla mediante instrucciones ALTER TABLE explícitas o la evolución automática del esquema. Consulta Actualización del esquema de tabla de Delta Lake.

La evolución del esquema tiene una semántica especial para las operaciones MERGE. Consulta Evolución automática del esquema para la combinación de Delta Lake.