Sdílet prostřednictvím


Rozsahy (horizontální datové oddíly)

Platí pro: ✅Microsoft FabricAzure Data Explorer

Tabulky jsou rozdělené do rozsahů nebo horizontálních oddílů dat. Každý rozsah je vodorovný segment tabulky, který obsahuje data a metadata, jako je čas vytvoření a volitelné značky. Sjednocení všech těchto rozsahů obsahuje celou datovou sadu tabulky. Rozsahy se rovnoměrně distribuují mezi uzly v clusteru a ukládají se do mezipaměti v místním disku SSD i paměti pro optimalizovaný výkon.

Rozsahy jsou neměnné, což znamená, že je možné je dotazovat, znovu přiřadit jinému uzlu nebo vynechat z tabulky, ale nikdy je neupravovat. Změny dat probíhají vytvořením nových rozsahů a transakčním prohozením starých rozsahů s novými rozsahy. Neměnnost rozsahů poskytuje výhody, jako je zvýšená robustnost a snadná reverze k předchozím snímkům.

Rozsahy obsahují kolekci záznamů, které jsou fyzicky uspořádány ve sloupcích, což umožňuje efektivní kódování a kompresi dat. Kvůli zachování efektivity dotazů se menší rozsahy sloučí do větších rozsahů podle nakonfigurovaných zásad sloučení a zásad horizontálního dělení. Sloučení rozsahů snižuje režii správy a vede k optimalizaci indexů a lepší kompresi.

Běžný životní cyklus je následující:

  1. Rozsah je vytvořen operací příjmu dat.
  2. Rozsah se sloučí s jinými rozsahy.
  3. Sloučený rozsah (pravděpodobně takový, který sleduje rodokmen do jiných rozsahů), se nakonec vyřadí kvůli zásadám uchovávání informací.

Čas vytvoření rozsahu

Dva hodnoty data a času jsou sledovány v rozsahu: MinCreatedOn a MaxCreatedOn. Tyto hodnoty jsou zpočátku stejné, ale mohou se změnit při sloučení rozsahu s jinými rozsahy. Při sloučení rozsahu s jinými rozsahy jsou nové hodnoty v závislosti na původním minimálním a maximálním počtu hodnot sloučených rozsahů.

Čas vytvoření rozsahu se používá pro následující účely:

  • Uchovávání informací: Rozsahy vytvořené dříve se zahodí dříve.
  • Ukládání do mezipaměti: Rozsahy vytvořené nedávno se uchovávají v horké mezipaměti.
  • Vzorkování: Nedávné rozsahy se preferují při použití operací dotazů, jako je například převzetí.

Pokud chcete přepsat čas vytvoření rozsahu, zadejte alternativní creationTime hodnotu ve vlastnostech příjmu dat. To může být užitečné pro účely uchovávání informací, například pokud chcete znovu ingestovat data, ale nechcete, aby se zobrazovala, jako by přišla pozdě.

Poznámka:

Výpočet pro odebrání rozsahu na základě času využívá čas vytvoření nejnovějšího rozsahu v rámci sloučeného rozsahu.