Tabelgrootte schatten
Van toepassing op: ✅Microsoft Fabric✅Azure Data Explorer-
Inzicht in de grootte van een tabel kan handig zijn voor efficiënt resourcebeheer en geoptimaliseerde queryprestaties. In dit artikel leert u verschillende methoden om tabelgrootten te schatten en hoe u deze effectief kunt gebruiken.
Oorspronkelijke grootte van opgenomen gegevens
Gebruik de .show table details om de oorspronkelijke gegevensgrootte van een tabel te schatten. Zie bijvoorbeeld .show table detailsgebruiken.
Deze opdracht biedt een schatting van de niet-gecomprimeerde grootte van gegevens die zijn opgenomen in uw tabel op basis van de veronderstelling dat de gegevens zijn overgedragen in CSV-indeling. De schatting is gebaseerd op geschatte lengten van numerieke waarden, zoals gehele getallen, longen, datum/tijd en guids, door de tekenreeksweergaven ervan te overwegen.
voorbeeldgebruik: De grootte van binnenkomende gegevens in de loop van de tijd bijhouden om weloverwogen beslissingen te nemen over capaciteitsplanning.
Tabelgrootte in termen van toegangsbytes
Gebruik de estimate_data_size() samen met de aggregatiefunctie sum() om de tabelgrootte te schatten op basis van gegevenstypen en de bijbehorende bytegrootten. Zie Estimate_data_size()gebruiken voor een voorbeeld.
Deze methode biedt een nauwkeurigere schatting door de bytegrootten van numerieke waarden te overwegen zonder ze als tekenreeksen op te maken. Voor gehele getallen is bijvoorbeeld 4 bytes vereist, terwijl lange en datum/tijd-waarden 8 bytes vereisen. Door deze methode te gebruiken, kunt u een nauwkeurige schatting maken van de gegevensgrootte die in het geheugen past.
voorbeeldgebruik: de kosten van een query bepalen in termen van bytes die moeten worden gescand.
Gecombineerde grootte van meerdere tabellen
U kunt de operator
voorbeeldgebruik: De geheugenvereisten voor het consolideren van gegevens uit meerdere tabellen in één gegevensset evalueren.
Notitie
Deze methode kan de geschatte gegevensgrootte vergroten vanwege lege kolommen, omdat union
alle kolommen uit de opgegeven tabellen combineert en estimate_data_size()
rekening houdt met lege kolommen bij het berekenen van de gegevensgrootte.
Voorbeelden
Tabeldetails weergeven gebruiken
De volgende query maakt een schatting van de oorspronkelijke gegevensgrootte van de StormEvents
tabel.
.show table StormEvents details
| project TotalOriginalSize
uitvoer
TotalOriginalSize |
---|
60192011 |
Fooi
Als u het bytesresultaat wilt opmaken voor MB
, GB
of een andere eenheid, gebruikt u format_bytes().
Gebruik estimate_data_size()
Met de volgende query wordt de oorspronkelijke gegevensgrootte van de StormEvents
tabel in bytes geschat.
StormEvents
| extend sizeEstimateOfColumn = estimate_data_size(*)
| summarize totalSize=sum(sizeEstimateOfColumn)
uitvoer
totalSize |
---|
58608932 |
Notitie
De uitvoer is kleiner, ook al wordt de berekening uitgevoerd in dezelfde tabel. Dit komt doordat deze methode een nauwkeurigere schatting biedt door de bytegrootten van numerieke waarden te overwegen zonder ze als tekenreeksen op te maken.
Samenvoeging gebruiken met estimate_data_size()
Met de volgende query wordt de gegevensgrootte geschat op basis van alle tabellen in de Samples
-database.
union withsource=_TableName *
| extend sizeEstimateOfColumn = estimate_data_size(*)
| summarize totalSize=sum(sizeEstimateOfColumn)
| extend sizeGB = format_bytes(totalSize,2,"GB")
totalSize | sizeGB |
---|---|
1761782453926 | 1640,79 GB |