Compartir a través de


CACHE TABLE

Se aplica a: casilla marcada como Sí Databricks Runtime

Almacena en caché el contenido de una tabla o salida de una consulta con el nivel de almacenamiento dado en la caché de Apache Spark. Si una consulta se almacena en caché, se crea una vista temporal de esa consulta. Esto reduce el examen de los archivos originales en consultas futuras.

Sintaxis

CACHE [ LAZY ] TABLE table_name
  [ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]

Consulte caché de disco frente a caché de Spark para las diferencias entre el almacenamiento en caché de disco y la caché de Apache Spark.

Parámetros

  • LAZY

    Solo almacena en caché la tabla cuando se usa por primera vez, en lugar de inmediatamente.

  • table_name

    Identifica la tabla o vista Delta que se va a almacenar en caché. El nombre no debe incluir una especificación temporal. Si no se encuentra la tabla, Azure Databricks genera un error TABLE_OR_VIEW_NOT_FOUND.

  • OPTIONS ( ‘storageLevel’ [ = ] value )

    Cláusula OPTIONS con un par clave-valor storageLevel. Se emite una advertencia cuando se usa una clave distinta de storageLevel. Las opciones válidas para storageLevel son:

    • NONE
      • DISK_ONLY
      • DISK_ONLY_2
      • MEMORY_ONLY
      • MEMORY_ONLY_2
      • MEMORY_ONLY_SER
      • MEMORY_ONLY_SER_2
      • MEMORY_AND_DISK
      • MEMORY_AND_DISK_2
      • MEMORY_AND_DISK_SER
      • MEMORY_AND_DISK_SER_2
      • OFF_HEAP

    Se produce una excepción cuando se establece un valor no válido para storageLevel. Si storageLevel no se establece explícitamente mediante la cláusula OPTIONS, el valor predeterminado de storageLevel se establece en MEMORY_AND_DISK.

  • consulta

    Consulta que genera las filas que se almacenarán en caché. Puede estar en uno de los formatos siguientes:

    • Una instrucción SELECT
    • Una instrucción TABLE
    • Una instrucción FROM

Ejemplos

> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;