Condividi tramite


Stimare le dimensioni della tabella

Si applica a: ✅Microsoft FabricEsplora dati di Azure

Comprendere le dimensioni di una tabella può essere utile per una gestione efficiente delle risorse e ottimizzare le prestazioni delle query. In questo articolo verranno illustrati metodi diversi per stimare le dimensioni delle tabelle e come usarli in modo efficace.

Dimensioni originali dei dati inseriti

Usare il .show dei dettagli della tabella per stimare le dimensioni dei dati originali di una tabella. Per un esempio, vedere Usare i dettagli della tabella .show.

Questo comando fornisce una stima delle dimensioni non compresse dei dati inseriti nella tabella in base al presupposto che i dati siano stati trasferiti in formato CSV. La stima si basa su lunghezze approssimative di valori numerici, ad esempio numeri interi, long, datetime e GUID, considerando le relative rappresentazioni di stringa.

caso d'uso di esempio: Tenere traccia delle dimensioni dei dati in ingresso nel tempo per prendere decisioni informate sulla pianificazione della capacità.

Dimensioni della tabella in termini di byte di accesso

Usare il estimate_data_size() insieme alla funzione di aggregazione sum() per stimare le dimensioni della tabella in base ai tipi di dati e alle rispettive dimensioni dei byte. Per un esempio, vedere Usare estimate_data_size().

Questo metodo fornisce una stima più precisa considerando le dimensioni dei byte dei valori numerici senza formattarle come stringhe. Ad esempio, i valori integer richiedono 4 byte, mentre i valori long e datetime richiedono 8 byte. Usando questo approccio, è possibile stimare accuratamente le dimensioni dei dati che si adattano alla memoria.

caso d'uso di esempio: Determinare il costo di una query in termini di byte da analizzare.

Dimensioni combinate di più tabelle

È possibile usare l'operatore unione insieme alle funzioni di estimate_data_size e sum() per stimare le dimensioni combinate di più tabelle in termini di byte di accesso. Per un esempio, vedere Usare l'unione con estimate_data_size().

caso d'uso di esempio: Valutare i requisiti di memoria per consolidare i dati da più tabelle in un singolo set di dati.

Nota

Questo approccio può gonfiare le dimensioni stimate dei dati a causa di colonne vuote, perché union combina tutte le colonne delle tabelle specificate e estimate_data_size() tiene conto delle colonne vuote durante il calcolo delle dimensioni dei dati.

Esempi

Usare i dettagli della tabella .show

La query seguente stima le dimensioni dei dati originali della tabella StormEvents.

.show table StormEvents details
| project TotalOriginalSize

output

TotalOriginalSize
60192011

Mancia

Per formattare il risultato dei byte per MB, GBo un'altra unità, usare format_bytes().

Usare estimate_data_size()

La query seguente stima le dimensioni dei dati originali della tabella StormEvents in byte.

StormEvents
| extend sizeEstimateOfColumn = estimate_data_size(*)
| summarize totalSize=sum(sizeEstimateOfColumn)

output

totalSize
58608932

Nota

L'output è più piccolo anche se il calcolo viene eseguito sulla stessa tabella. Questo perché questo metodo fornisce una stima più precisa considerando le dimensioni dei byte dei valori numerici senza formattarle come stringhe.

Usare l'unione con estimate_data_size()

La query seguente stima le dimensioni dei dati in base a tutte le tabelle nel database Samples.

union withsource=_TableName *
| extend sizeEstimateOfColumn = estimate_data_size(*)
| summarize totalSize=sum(sizeEstimateOfColumn)
| extend sizeGB = format_bytes(totalSize,2,"GB")
totalSize Dimensioni GB
1761782453926 1640,79 GB