Delen via


Tabelgrootte schatten

Van toepassing op: ✅Microsoft FabricAzure Data Explorer-

Inzicht in de grootte van een tabel kan handig zijn voor efficiënt resourcebeheer en geoptimaliseerde queryprestaties. In dit artikel leert u verschillende methoden om tabelgrootten te schatten en hoe u deze effectief kunt gebruiken.

Oorspronkelijke grootte van opgenomen gegevens

Gebruik de .show table details om de oorspronkelijke gegevensgrootte van een tabel te schatten. Zie bijvoorbeeld .show table detailsgebruiken.

Deze opdracht biedt een schatting van de niet-gecomprimeerde grootte van gegevens die zijn opgenomen in uw tabel op basis van de veronderstelling dat de gegevens zijn overgedragen in CSV-indeling. De schatting is gebaseerd op geschatte lengten van numerieke waarden, zoals gehele getallen, longen, datum/tijd en guids, door de tekenreeksweergaven ervan te overwegen.

voorbeeldgebruik: De grootte van binnenkomende gegevens in de loop van de tijd bijhouden om weloverwogen beslissingen te nemen over capaciteitsplanning.

Tabelgrootte in termen van toegangsbytes

Gebruik de estimate_data_size() samen met de aggregatiefunctie sum() om de tabelgrootte te schatten op basis van gegevenstypen en de bijbehorende bytegrootten. Zie Estimate_data_size()gebruiken voor een voorbeeld.

Deze methode biedt een nauwkeurigere schatting door de bytegrootten van numerieke waarden te overwegen zonder ze als tekenreeksen op te maken. Voor gehele getallen is bijvoorbeeld 4 bytes vereist, terwijl lange en datum/tijd-waarden 8 bytes vereisen. Door deze methode te gebruiken, kunt u een nauwkeurige schatting maken van de gegevensgrootte die in het geheugen past.

voorbeeldgebruik: de kosten van een query bepalen in termen van bytes die moeten worden gescand.

Gecombineerde grootte van meerdere tabellen

U kunt de operator samenvoeging gebruiken, samen met de functies estimate_data_size() en sum() om de gecombineerde grootte van meerdere tabellen in termen van toegangsbytes te schatten. Zie Samenvoeging gebruiken met estimate_data_size()voor een voorbeeld.

voorbeeldgebruik: De geheugenvereisten voor het consolideren van gegevens uit meerdere tabellen in één gegevensset evalueren.

Notitie

Deze methode kan de geschatte gegevensgrootte vergroten vanwege lege kolommen, omdat union alle kolommen uit de opgegeven tabellen combineert en estimate_data_size() rekening houdt met lege kolommen bij het berekenen van de gegevensgrootte.

Voorbeelden

Tabeldetails weergeven gebruiken

De volgende query maakt een schatting van de oorspronkelijke gegevensgrootte van de StormEvents tabel.

.show table StormEvents details
| project TotalOriginalSize

uitvoer

TotalOriginalSize
60192011

Fooi

Als u het bytesresultaat wilt opmaken voor MB, GBof een andere eenheid, gebruikt u format_bytes().

Gebruik estimate_data_size()

Met de volgende query wordt de oorspronkelijke gegevensgrootte van de StormEvents tabel in bytes geschat.

StormEvents
| extend sizeEstimateOfColumn = estimate_data_size(*)
| summarize totalSize=sum(sizeEstimateOfColumn)

uitvoer

totalSize
58608932

Notitie

De uitvoer is kleiner, ook al wordt de berekening uitgevoerd in dezelfde tabel. Dit komt doordat deze methode een nauwkeurigere schatting biedt door de bytegrootten van numerieke waarden te overwegen zonder ze als tekenreeksen op te maken.

Samenvoeging gebruiken met estimate_data_size()

Met de volgende query wordt de gegevensgrootte geschat op basis van alle tabellen in de Samples-database.

union withsource=_TableName *
| extend sizeEstimateOfColumn = estimate_data_size(*)
| summarize totalSize=sum(sizeEstimateOfColumn)
| extend sizeGB = format_bytes(totalSize,2,"GB")
totalSize sizeGB
1761782453926 1640,79 GB