Sdílet prostřednictvím


Principy uchovávání dat v Azure Time Series Insights Gen1

Poznámka

Služba Time Series Insights bude vyřazena 7. července 2024. Zvažte migraci stávajících prostředí na alternativní řešení co nejdříve. Další informace o vyřazení a migraci najdete v naší dokumentaci.

Opatrnost

Toto je článek Gen1.

Tento článek popisuje dvě primární nastavení, která mají vliv na uchovávání dat v prostředí Azure Time Series Insights.

Video

Následující video shrnuje uchovávání dat Azure Time Series Insights a způsob jejich plánování.

Každé prostředí Azure Time Series Insights má nastavení, které řídí dobu uchovávání dat . Hodnota se liší od 1 do 400 dnů. Data se odstraní na základě kapacity úložiště prostředí nebo doby uchování podle toho, co nastane dříve.

Prostředí Azure Time Series Insights má navíc nastavení chování pro překročení limitu úložiště. Řídí chování při příjmu a vyčištění dat, když je dosaženo maximální kapacity prostředí. Při konfiguraci si můžete vybrat ze dvou chování:

  • vyprázdnění starých dat (výchozí)
  • pozastavení příchozího přenosu dat

Poznámka

Ve výchozím nastavení je při vytváření nového prostředí nastaveno uchovávání dat na odstranění starých dat. Toto nastavení můžete podle potřeby přepnout po vytvoření pomocí Azure portálu na stránce Konfigurovat prostředí Azure Time Series Insights.

Obě zásady uchovávání dat jsou podrobněji popsány níže.

Vymazání starých dat

  • vyprázdnění starých dat je výchozím nastavením pro prostředí Azure Time Series Insights.
  • Odstranění starých dat se upřednostňuje, když uživatelé chtějí mít v prostředí Azure Time Series Insights vždy nejnovější data.
  • Nastavení vyprázdnění starých dat data vyprázdní, jakmile dojde k dosažení limitů prostředí (doba uchovávání, velikost nebo počet podle toho, co nastane dříve). Ve výchozím nastavení je uchovávání nastavené na 30 dnů.
  • Nejstarší zpracovaná data se vymažou jako první (metoda "První dovnitř, první ven").

Příklad 1

Představte si ukázkové prostředí s chováním uchovávání Pokračovat v příchozím přenosu dat a vyprázdnit stará data:

doba uchovávání dat je nastavená na 400 dnů. Kapacita je nastavená na jednotku S1, která obsahuje 30 GB celkové kapacity. Předpokládejme, že příchozí data se v průměru hromadí na 500 MB. Toto prostředí může uchovávat data pouze po dobu 60 dnů vzhledem k rychlosti příchozích dat, protože maximální kapacita je dosažena po 60 dnech. Příchozí data se hromadí jako: 500 MB každý den x 60 dní = 30 GB.

61. den prostředí zobrazuje nejnovější data, ale vyprázdní nejstarší data starší než 60 dnů. Vyprázdnění dává prostor pro nové streamování dat, aby se nová data mohla dál zkoumat. Pokud si uživatel přeje uchovávat data déle, může zvětšit velikost prostředí přidáním dalších jednotek nebo může nasdílit méně dat.

Příklad 2

Zvažte prostředí a nakonfigurované chování uchovávání , pokračujte v přenosu příchozích dat a vyprázdněte stará data. V tomto příkladu je doba uchovávání dat nastavená na nižší hodnotu 180 dnů. Kapacita je nastavená na jednotku S1, která obsahuje 30 GB celkové kapacity. Aby bylo možné ukládat data za celých 180 dnů, denní příchozí přenos dat nesmí překročit 0,166 GB (166 MB) za den.

Kdykoli denní rychlost příchozího přenosu dat tohoto prostředí překročí 0,166 GB za den, data se nedají uložit po dobu 180 dnů, protože se některá data vymažou. Zvažte stejné prostředí během zaneprázdněného období. Předpokládejme, že míra datového přenosu do prostředí se může zvýšit na průměrnou hodnotu 0,189 GB za den. V daném zaneprázdněném časovém rámci se uchovává přibližně 158 dnů dat (30 GB/0,189 = 158,73 dnů uchovávání). Tento časový rámec je kratší než požadovaná doba uchovávání dat.

Pozastavit přístup

  • Nastavení Pozastavit příchozí přenos dat je navržené tak, aby se zajistilo, že data nebudou vyprázdněna, pokud se před dobou uchovávání dosáhne limitů velikosti a počtu.

  • pozastavení příchozího přenosu dat uživatelům poskytuje další čas, aby zvýšili kapacitu svého prostředí před vymazáním dat kvůli porušení doby uchovávání.

  • Pomáhá chránit vás před ztrátou dat, ale může vytvořit příležitost pro ztrátu nejnovějších dat, pokud se příchozí přenos dat pozastaví nad rámec doby uchovávání vašeho zdroje událostí.

  • Jakmile však dojde k dosažení maximální kapacity prostředí, prostředí pozastaví příchozí přenos dat, dokud nedojde k následujícím dalším akcím:

    • Zvýšíte maximální kapacitu prostředí a přidáte další jednotky škálování, jak je popsáno v tématu Postup škálování prostředí Azure Time Series Insights.
    • Doba uchovávání dat je dosažena a data jsou odstraněna, čímž se prostředí dostává pod maximální kapacitu.

Příklad 3

Zvažte prostředí s nakonfigurovaným chováním uchovávání informací tak, aby pozastavení příchozího přenosu dat. V tomto příkladu je doba uchovávání dat nakonfigurovaná na 60 dnů. Kapacita je nastavená na tři (3) jednotky S1. Předpokládejme, že toto prostředí má každý den příchozí přenos dat o velikosti 2 GB. V tomto prostředí se příchozí přenos dat pozastaví po dosažení maximální kapacity.

V tomto okamžiku prostředí zobrazuje stejnou datovou sadu, dokud se příchozí přenos dat neobnoví nebo dokud není povoleno pokračování příchozího přenosu (což vyprázdní starší data, aby se uvolnilo místo pro nová data).

Při obnovení vstupu:

  • Toky dat v pořadí, v jakém byly přijaty zdrojem událostí
  • Události se indexují na základě jejich časového razítka, pokud jste nepřekročili zásady uchovávání informací ve zdroji událostí. Další informace o konfiguraci uchovávání zdrojů událostí Event Hubs – nejčastější dotazy

Důležitý

Měli byste nastavit upozornění, která vám pomůžou zabránit pozastavení příchozího přenosu dat. Ztráta dat je možná, protože výchozí uchovávání dat je 1 den pro zdroje událostí Azure. Proto po pozastavení příchozího přenosu dat pravděpodobně ztratíte nejnovější data, pokud se neprovedou další akce. Pokud chcete zabránit potenciální ztrátě dat, musíte zvýšit kapacitu nebo přepnout chování vyprázdnit stará data.

V ovlivněných službách Event Hubs zvažte úpravu vlastnosti uchovávání zpráv, aby se minimalizovala ztráta dat při pozastavení příjmu v Azure Time Series Insights.

uchovávání zpráv v centru událostí.

Pokud nejsou ve zdroji událostí (timeStampPropertyName) nakonfigurované žádné vlastnosti, Azure Time Series Insights jako osa X ve výchozím nastavení nastaví časové razítko příjezdu do centra událostí. Pokud je timeStampPropertyName nakonfigurované na něco jiného, prostředí hledá nakonfigurované timeStampPropertyName v datovém paketu při analýze událostí.

Přečtěte si Jak škálovat prostředí Azure Time Series Insights, abyste přizpůsobili své prostředí pro další kapacitu nebo prodloužili dobu uchovávání.

Další kroky