Compartir a través de


Calcular el tamaño de la tabla

Se aplica a: ✅Microsoft Fabricazure Data Explorer

Comprender el tamaño de una tabla puede resultar útil para una administración eficaz de recursos y un rendimiento optimizado de las consultas. En este artículo, aprenderá diferentes métodos para calcular los tamaños de tabla y cómo usarlos de forma eficaz.

Tamaño original de los datos ingeridos

Use la detalles de la tabla .show para calcular el tamaño de datos original de una tabla. Para obtener un ejemplo, vea Use .show table details.

Este comando proporciona una estimación del tamaño sin comprimir de los datos ingeridos en la tabla en función de la suposición de que los datos se transfirieron en formato CSV. La estimación se basa en longitudes aproximadas de valores numéricos, como enteros, longs, datetimes y guids, considerando sus representaciones de cadena.

Caso de uso de ejemplo: Realizar un seguimiento del tamaño de los datos entrantes a lo largo del tiempo para tomar decisiones fundamentadas sobre el planeamiento de la capacidad.

Tamaño de tabla en términos de bytes de acceso

Use el estimate_data_size() junto con la función de agregación sum() para calcular el tamaño de la tabla en función de los tipos de datos y sus respectivos tamaños de bytes. Para obtener un ejemplo, consulte Use estimate_data_size().

Este método proporciona una estimación más precisa teniendo en cuenta los tamaños de bytes de valores numéricos sin darles formato como cadenas. Por ejemplo, los valores enteros requieren 4 bytes, mientras que los valores long y datetime requieren 8 bytes. Mediante este enfoque, puede calcular con precisión el tamaño de los datos que caben en la memoria.

Caso de uso de ejemplo: Determinar el costo de una consulta en términos de bytes que se van a examinar.

Tamaño combinado de varias tablas

Puede usar el operador union junto con las funciones estimate_data_size() y sum() para calcular el tamaño combinado de varias tablas en términos de bytes de acceso. Para obtener un ejemplo, vea Use union with estimate_data_size().

Caso de uso de ejemplo: Evaluar los requisitos de memoria para consolidar datos de varias tablas en un único conjunto de datos.

Nota

Este enfoque puede inflar el tamaño estimado de los datos debido a columnas vacías, ya que union combina todas las columnas de las tablas especificadas y estimate_data_size() tiene en cuenta las columnas vacías al calcular el tamaño de los datos.

Ejemplos

Uso de los detalles de la tabla .show

La consulta siguiente calcula el tamaño de datos original de la tabla StormEvents.

Ejecutar el de consulta

.show table StormEvents details
| project TotalOriginalSize

de salida

TotalOriginalSize
60192011

Propina

Para dar formato al resultado de bytes a MB, GBu otra unidad, use format_bytes().

Usar estimate_data_size()

La consulta siguiente calcula el tamaño de datos original de la tabla StormEvents en bytes.

Ejecutar el de consulta

StormEvents
| extend sizeEstimateOfColumn = estimate_data_size(*)
| summarize totalSize=sum(sizeEstimateOfColumn)

de salida

totalSize
58608932

Nota

La salida es más pequeña aunque el cálculo se realice en la misma tabla. Esto se debe a que este método proporciona una estimación más precisa teniendo en cuenta los tamaños de bytes de valores numéricos sin aplicarles formato como cadenas.

Uso de union con estimate_data_size()

La consulta siguiente calcula el tamaño de los datos en función de todas las tablas de la base de datos de Samples.

Ejecutar el de consulta

union withsource=_TableName *
| extend sizeEstimateOfColumn = estimate_data_size(*)
| summarize totalSize=sum(sizeEstimateOfColumn)
| extend sizeGB = format_bytes(totalSize,2,"GB")
totalSize sizeGB
1761782453926 1640,79 GB