Udostępnij za pośrednictwem


Planowanie środowiska usługi Azure Time Series Insights Gen1

Notatka

Usługa Time Series Insights zostanie wycofana 7 lipca 2024 r. Rozważ migrację istniejących środowisk do alternatywnych rozwiązań tak szybko, jak to możliwe. Aby uzyskać więcej informacji na temat stopniowego wycofywania funkcji i migracji, odwiedź naszą dokumentację .

Ostrożność

Jest to artykuł Gen1.

W tym artykule opisano sposób planowania środowiska usługi Azure Time Series Insights Gen1 na podstawie oczekiwanej szybkości ruchu przychodzącego i wymagań dotyczących przechowywania danych.

Wideo

obejrzyj ten film wideo, aby dowiedzieć się więcej o przechowywaniu danych w usłudze Azure Time Series Insights i sposobie planowania jej:

Najlepsze rozwiązania

Aby rozpocząć pracę z usługą Azure Time Series Insights, najlepiej, jeśli wiesz, ile danych oczekujesz przesyłać na minutę i jak długo musisz przechowywać swoje dane.

Aby uzyskać więcej informacji na temat pojemności i retencji dla jednostek SKU usługi Azure Time Series Insights, przeczytaj cennik usługi Azure Time Series Insights.

Aby najlepiej zaplanować środowisko usługi Azure Time Series Insights pod kątem długoterminowego sukcesu, należy wziąć pod uwagę następujące atrybuty:

Pojemność

Domyślnie usługa Azure Time Series Insights przechowuje dane na podstawie ilości przyznanej pamięci (jednostki × ilość miejsca na jednostkę) i danych przychodzących.

Przechowywanie danych

Możesz zmienić ustawienie czasu przechowywania danych w środowisku usługi Azure Time Series Insights. Okres przechowywania może być maksymalnie 400 dni.

Usługa Azure Time Series Insights ma dwa tryby:

  • Jeden z trybów optymalizuje pod kątem najnowszych danych up-to. Wymusza politykę usuwania starych danych pozostawiając ostatnie dane dostępne w wystąpieniu. Ten tryb jest domyślnie włączony.
  • Druga optymalizuje dane, aby pozostały poniżej skonfigurowanych limitów przechowywania. Pauza dla ruchu przychodzącego zapobiega napływowi nowych danych, gdy zostanie wybrane jako zachowanie po przekroczeniu limitu magazynowania.

Przechowywanie i przełączanie między dwoma trybami można dostosować na stronie konfiguracji środowiska w witrynie Azure Portal.

Ważny

Można skonfigurować maksymalne przechowywanie danych do 400 dni w swoim środowisku usługi Azure Time Series Insights Gen1.

Konfigurowanie przechowywania danych

  1. W portalu Azurewybierz środowisko Time Series Insights.

  2. W okienku środowiska usługi Time Series Insights w obszarze Ustawienia wybierz pozycję Konfiguracja magazynu.

  3. W polu Czas przechowywania danych (w dniach) wprowadź wartość z zakresu od 1 do 400.

    Konfigurowanie przechowywania

Napiwek

Aby dowiedzieć się więcej na temat implementowania odpowiednich zasad przechowywania danych, przeczytaj Jak skonfigurować przechowywanie.

Pojemność ruchu przychodzącego

Poniżej przedstawiono podsumowanie kluczowych limitów w usłudze Azure Time Series Insights Gen1.

Współczynniki ruchu przychodzącego i pojemności jednostek SKU

Wskaźniki i pojemności ruchu przychodzącego jednostek SKU S1 i S2 zapewniają elastyczność podczas tworzenia nowego środowiska usługi Azure Time Series Insights. Pojemność jednostki SKU wskazuje dzienną szybkość przyjmowania danych na podstawie liczby zdarzeń lub bajtów przechowywanych, w zależności od tego, co nastąpi pierwsze. Należy pamiętać, że ruch przychodzący jest mierzony na minutę, a ograniczanie przepustowości jest stosowane przy użyciu algorytmu zasobnika tokenu. Ingress jest mierzony w blokach 1 KB. Na przykład rzeczywiste zdarzenie o rozmiarze 0,8 KB będzie mierzone jako jedno zdarzenie, a zdarzenie o rozmiarze 2,6 KB jest liczone jako trzy zdarzenia.

Pojemność jednostki SKU S1 Szybkość ruchu przychodzącego Maksymalna pojemność magazynu
1 1 GB (1 milion zdarzeń) dziennie 30 GB (30 milionów zdarzeń)
10 10 GB (10 milionów zdarzeń) dziennie 300 GB (300 milionów zdarzeń)
Pojemność jednostki SKU S2 Szybkość ruchu przychodzącego Maksymalna pojemność magazynu
1 10 GB (10 milionów zdarzeń) dziennie 300 GB (300 milionów zdarzeń)
10 100 GB (100 milionów zdarzeń) dziennie 3 TB (3 miliardy zdarzeń)

Notatka

Pojemności skalują się liniowo, więc jednostka SKU S1 o pojemności 2 obsługuje przepustowość 2 GB (2 miliardy bajtów) zdarzeń dziennie oraz 60 GB (60 miliardów bajtów) miesięcznie.

Środowiska SKU S2 obsługują znacznie więcej zdarzeń w miesiącu i mają znacznie większą przepustowość ruchu przychodzącego.

SKU (Numer jednostki magazynowej) Liczba zdarzeń na miesiąc Liczba zdarzeń na minutę Rozmiar zdarzenia na minutę
S1 30 milionów 720 720 KB
S2 300 milionów 7,200 7200 KB

Limity nieruchomości

Limity właściwości Gen1 zależą od wybranego środowiska jednostki SKU. Podane właściwości zdarzenia mają odpowiednie kolumny JSON, CSV i wykres, które można wyświetlić w Azure Time Series Insights Explorer.

SKU Maksymalna wartość właściwości
S1 600 właściwości (kolumny)
S2 800 atrybutów (kolumny)

Źródła zdarzeń

Obsługiwane są maksymalnie dwa źródła zdarzeń na wystąpienie.

Limity interfejsu API

Limity interfejsu API REST dla usługi Azure Time Series Insights Gen1 są określone w dokumentacji referencyjnej interfejsu API REST .

Planowanie środowiska

Drugi obszar, na którym należy się skoncentrować przy planowaniu środowiska usługi Azure Time Series Insights, to pojemność przyjmowania danych. Dzienna pamięć masowa przychodząca i pojemność na zdarzenia jest mierzona w przeliczeniu na minutę, w blokach po 1 KB. Maksymalny dozwolony rozmiar pakietu to 32 KB. Pakiety danych większe niż 32 KB są obcinane.

Pojemność jednostki SKU S1 lub S2 można zwiększyć do 10 jednostek w jednym środowisku. Nie można przeprowadzić migracji ze środowiska S1 do S2. Nie można przeprowadzić migracji ze środowiska S2 do S1.

W przypadku pojemności dla ruchu przychodzącego najpierw określ łączne zapotrzebowanie na ruch przychodzący na podstawie miesiąca. Następnie określ, jakie są twoje potrzeby na minutę.

Ograniczanie przepustowości i opóźnienia mają wpływ na wydajność na minutę. Jeśli wystąpi skok w danych przychodzących, który trwa mniej niż 24 godziny, usługa Azure Time Series Insights może "nadrobić zaległości" w tempie dwukrotnie wyższym niż w wcześniejszej tabeli.

Jeśli na przykład masz pojedynczą jednostkę SKU S1 i przetwarzasz dane z prędkością 720 zdarzeń na minutę, a szybkość danych wzrasta przez mniej niż jedną godzinę do 1440 zdarzeń lub mniej, nie ma zauważalnego opóźnienia w środowisku. Jeśli jednak przekroczysz 1440 zdarzeń na minutę przez więcej niż jedną godzinę, prawdopodobnie wystąpi opóźnienie w danych, które są wizualizowane i dostępne dla zapytań w środowisku.

Możesz nie wiedzieć z wyprzedzeniem, ile danych zamierzasz wysłać. W takim przypadku można znaleźć dane telemetryczne dla usługi Azure IoT Hub i azure Event Hubs w subskrypcji witryny Azure Portal. Dane telemetryczne mogą pomóc w ustaleniu, jak skonfigurować środowisko. Użyj okienka metryk w portalu Azure, aby wyświetlić dane telemetryczne dla odpowiedniego źródła zdarzeń. Jeśli rozumiesz metryki źródła zdarzeń, możesz efektywniej planować i aprowizować środowisko usługi Azure Time Series Insights.

Obliczanie wymagań dotyczących ruchu wejściowego

Aby obliczyć swoje wymagania wejściowe:

  • Sprawdź, czy pojemność ruchu przychodzącego przekracza średnią szybkość na minutę i czy środowisko jest wystarczająco duże, aby obsłużyć oczekiwany ruch przychodzący odpowiadający dwa razy większej pojemności przez mniej niż jedną godzinę.

  • Jeśli występują skoki ruchu przychodzącego, które trwają dłużej niż 1 godzinę, użyj częstotliwości tych skoków jako średniej. Udostępnij środowisko z wystarczającą pojemnością do obsługi nagłego wzrostu zapotrzebowania.

Łagodzenie ograniczania przepustowości i opóźnień

Aby uzyskać informacje na temat zapobiegania ograniczaniu przepustowości i opóźnieniu, przeczytaj Ograniczenia opóźnień i ograniczania przepustowości.

Kształtuj swoje wydarzenia

Ważne jest, aby upewnić się, że sposób wysyłania zdarzeń do usługi Azure Time Series Insights jest dostosowany do rozmiaru środowiska, które przygotowujesz. (Z drugiej strony można mapować rozmiar środowiska na liczbę zdarzeń odczytanych w usłudze Azure Time Series Insights i rozmiar każdego zdarzenia). Ważne jest również, aby rozważyć atrybuty, których można użyć do fragmentowania i filtrowania według podczas wykonywania zapytań dotyczących danych.

Napiwek

Zapoznaj się z dokumentacją kształtowania kodu JSON w Wysyłanie zdarzeń.

Upewnij się, że masz dane referencyjne

Zestaw danych referencyjnych to kolekcja elementów, które rozszerzają zdarzenia ze źródła zdarzeń. Silnik przetwarzania danych wejściowych usługi Azure Time Series Insights łączy każde zdarzenie ze źródła zdarzeń z odpowiednim wierszem w zestawie danych referencyjnych. Zdarzenie rozszerzone jest następnie dostępne do zapytań. Sprzężenie jest oparte na kolumnach klucza podstawowego zdefiniowanych w zestawie danych odniesienia.

Notatka

Dane referencyjne nie są przyłączone wstecznie. Tylko bieżące i przyszłe dane przychodzące są dopasowywane i dołączane do zestawu danych referencyjnych po ich skonfigurowaniu i przekazaniu. Jeśli planujesz wysłać dużą ilość danych historycznych do usługi Azure Time Series Insights i najpierw nie prześlesz ani nie utworzysz danych referencyjnych w usłudze Azure Time Series Insights, może się okazać, że będziesz musiał powtórzyć swoją pracę (podpowiedź: to nie jest frajda).

Aby dowiedzieć się więcej na temat tworzenia, przekazywania i zarządzania danymi referencyjnymi w usłudze Azure Time Series Insights, przeczytaj dokumentację zestawu danych referencyjnych .

Odzyskiwanie po awarii biznesowej

W tej sekcji opisano funkcje Azure Time Series Insights, które zapewniają działanie aplikacji i usług, nawet jeśli wystąpi katastrofa (znana jako odzyskiwanie po awarii biznesowej).

Wysoka dostępność

Jako usługa platformy Azure usługa Azure Time Series Insights zapewnia pewne funkcje wysokiej dostępności przy użyciu nadmiarowości na poziomie regionu świadczenia usługi Azure. Na przykład platforma Azure obsługuje możliwości odzyskiwania po awarii za pośrednictwem funkcji dostępności między regionami platformy Azure.

Dodatkowe funkcje zapewniające wysoką dostępność, które są udostępniane za pośrednictwem platformy Azure (a także dostępne dla dowolnego wystąpienia usługi Azure Time Series Insights), obejmują:

Upewnij się, że włączysz odpowiednie funkcje platformy Azure, aby zapewnić globalną wysoką dostępność między regionami dla urządzeń i użytkowników.

Notatka

Jeśli platforma Azure jest skonfigurowana do włączania dostępności między regionami, w usłudze Azure Time Series Insights nie jest wymagana żadna dodatkowa konfiguracja dostępności między regionami.

IoT i centra zdarzeń

Niektóre usługi Azure IoT obejmują również wbudowane funkcje odzyskiwania po awarii biznesowej:

Zintegrowanie usługi Azure Time Series Insights z innymi usługami zapewnia dodatkowe możliwości odzyskiwania po awarii. Na przykład dane telemetryczne wysyłane do centrum zdarzeń mogą być utrwalane w kopii zapasowej bazy danych usługi Azure Blob Storage.

Azure Time Series Insights (platforma do analizy szeregów czasowych)

Istnieje kilka sposobów utrzymania uruchomionych danych, aplikacji i usług usługi Azure Time Series Insights, nawet jeśli zostaną one zakłócone.

Można jednak określić, że wymagana jest również kompletna kopia zapasowa środowiska usługi Azure Time Series, w następujących celach:

  • Jako instancja failover specjalnie dla usługi Azure Time Series Insights w celu przekierowania danych i ruchu do
  • Aby zachować dane i informacje dotyczące inspekcji

Ogólnie rzecz biorąc, najlepszym sposobem duplikowania środowiska usługi Azure Time Series Insights jest utworzenie drugiego środowiska usługi Azure Time Series Insights w regionie kopii zapasowej platformy Azure. Zdarzenia są również wysyłane do tego środowiska pomocniczego z podstawowego źródła zdarzeń. Upewnij się, że używasz drugiej dedykowanej grupy odbiorców. Postępuj zgodnie z wcześniejszym opisem dotyczącym wytycznych do odzyskiwania po awarii biznesowej danego źródła.

Aby utworzyć zduplikowane środowisko:

  1. Utwórz środowisko w drugim regionie. Aby uzyskać więcej informacji, przeczytaj Tworzenie nowego środowiska usługi Azure Time Series Insights w witrynie Azure Portal.
  2. Utwórz drugą dedykowaną grupę odbiorców dla źródła zdarzeń.
  3. Połącz to źródło zdarzeń z nowym środowiskiem. Upewnij się, że wyznaczysz drugą dedykowaną grupę odbiorców.
  4. Zapoznaj się z dokumentacją usługi Azure Time Series Insights IoT Hub i Event Hubs.

Jeśli wystąpi zdarzenie:

  1. Jeśli region podstawowy jest dotknięty przez zdarzenie awarii, przekieruj operacje do zapasowego środowiska usługi Azure Time Series Insights.
  2. Ponieważ numery sekwencji koncentratora zaczynają się ponownie od 0 po przełączeniu awaryjnym, utwórz ponownie źródło zdarzeń w obu regionach/środowiskach z różnymi grupami konsumentów, aby uniknąć tworzenia zduplikowanych zdarzeń.
  3. Usuń źródło zdarzeń podstawowych, które jest teraz nieaktywne, aby zwolnić dostępne źródło zdarzeń dla danego środowiska. (Istnieje limit dwóch aktywnych źródeł zdarzeń w środowisku).
  4. Użyj drugiego regionu, aby utworzyć kopię zapasową i odzyskać wszystkie dane telemetryczne usługi Azure Time Series Insights i wysyłać zapytania o dane.

Ważny

Jeśli nastąpi przełączenie awaryjne:

  • Może również wystąpić opóźnienie.
  • Może wystąpić chwilowy skok przetwarzania komunikatów, ponieważ operacje są przekierowywane.

Aby uzyskać więcej informacji, przeczytaj Ograniczanie opóźnień w usłudze Azure Time Series Insights.

Następne kroki