Planowanie środowiska usługi Azure Time Series Insights Gen1
Notatka
Usługa Time Series Insights zostanie wycofana 7 lipca 2024 r. Rozważ migrację istniejących środowisk do alternatywnych rozwiązań tak szybko, jak to możliwe. Aby uzyskać więcej informacji na temat stopniowego wycofywania funkcji i migracji, odwiedź naszą dokumentację .
Ostrożność
Jest to artykuł Gen1.
W tym artykule opisano sposób planowania środowiska usługi Azure Time Series Insights Gen1 na podstawie oczekiwanej szybkości ruchu przychodzącego i wymagań dotyczących przechowywania danych.
Wideo
obejrzyj ten film wideo, aby dowiedzieć się więcej o przechowywaniu danych w usłudze Azure Time Series Insights i sposobie planowania jej:
Najlepsze rozwiązania
Aby rozpocząć pracę z usługą Azure Time Series Insights, najlepiej, jeśli wiesz, ile danych oczekujesz przesyłać na minutę i jak długo musisz przechowywać swoje dane.
Aby uzyskać więcej informacji na temat pojemności i retencji dla jednostek SKU usługi Azure Time Series Insights, przeczytaj cennik usługi Azure Time Series Insights.
Aby najlepiej zaplanować środowisko usługi Azure Time Series Insights pod kątem długoterminowego sukcesu, należy wziąć pod uwagę następujące atrybuty:
- Pojemność magazynu
- okres przechowywania danych
- pojemności ruchu przychodzącego
- Kształtowanie twoich wydarzeń
- upewnienie się, że istnieją dane referencyjne
Pojemność
Domyślnie usługa Azure Time Series Insights przechowuje dane na podstawie ilości przyznanej pamięci (jednostki × ilość miejsca na jednostkę) i danych przychodzących.
Przechowywanie danych
Możesz zmienić ustawienie czasu przechowywania danych w środowisku usługi Azure Time Series Insights. Okres przechowywania może być maksymalnie 400 dni.
Usługa Azure Time Series Insights ma dwa tryby:
- Jeden z trybów optymalizuje pod kątem najnowszych danych up-to. Wymusza politykę usuwania starych danych pozostawiając ostatnie dane dostępne w wystąpieniu. Ten tryb jest domyślnie włączony.
- Druga optymalizuje dane, aby pozostały poniżej skonfigurowanych limitów przechowywania. Pauza dla ruchu przychodzącego zapobiega napływowi nowych danych, gdy zostanie wybrane jako zachowanie po przekroczeniu limitu magazynowania.
Przechowywanie i przełączanie między dwoma trybami można dostosować na stronie konfiguracji środowiska w witrynie Azure Portal.
Ważny
Można skonfigurować maksymalne przechowywanie danych do 400 dni w swoim środowisku usługi Azure Time Series Insights Gen1.
Konfigurowanie przechowywania danych
W portalu Azurewybierz środowisko Time Series Insights.
W okienku środowiska usługi
Time Series Insights w obszarze Ustawienia wybierz pozycję Konfiguracja magazynu .W polu Czas przechowywania danych (w dniach) wprowadź wartość z zakresu od 1 do 400.
Napiwek
Aby dowiedzieć się więcej na temat implementowania odpowiednich zasad przechowywania danych, przeczytaj Jak skonfigurować przechowywanie.
Pojemność ruchu przychodzącego
Poniżej przedstawiono podsumowanie kluczowych limitów w usłudze Azure Time Series Insights Gen1.
Współczynniki ruchu przychodzącego i pojemności jednostek SKU
Wskaźniki i pojemności ruchu przychodzącego jednostek SKU S1 i S2 zapewniają elastyczność podczas tworzenia nowego środowiska usługi Azure Time Series Insights. Pojemność jednostki SKU wskazuje dzienną szybkość przyjmowania danych na podstawie liczby zdarzeń lub bajtów przechowywanych, w zależności od tego, co nastąpi pierwsze. Należy pamiętać, że ruch przychodzący jest mierzony na minutę, a ograniczanie przepustowości jest stosowane przy użyciu algorytmu zasobnika tokenu. Ingress jest mierzony w blokach 1 KB. Na przykład rzeczywiste zdarzenie o rozmiarze 0,8 KB będzie mierzone jako jedno zdarzenie, a zdarzenie o rozmiarze 2,6 KB jest liczone jako trzy zdarzenia.
Pojemność jednostki SKU S1 | Szybkość ruchu przychodzącego | Maksymalna pojemność magazynu |
---|---|---|
1 | 1 GB (1 milion zdarzeń) dziennie | 30 GB (30 milionów zdarzeń) |
10 | 10 GB (10 milionów zdarzeń) dziennie | 300 GB (300 milionów zdarzeń) |
Pojemność jednostki SKU S2 | Szybkość ruchu przychodzącego | Maksymalna pojemność magazynu |
---|---|---|
1 | 10 GB (10 milionów zdarzeń) dziennie | 300 GB (300 milionów zdarzeń) |
10 | 100 GB (100 milionów zdarzeń) dziennie | 3 TB (3 miliardy zdarzeń) |
Notatka
Pojemności skalują się liniowo, więc jednostka SKU S1 o pojemności 2 obsługuje przepustowość 2 GB (2 miliardy bajtów) zdarzeń dziennie oraz 60 GB (60 miliardów bajtów) miesięcznie.
Środowiska SKU S2 obsługują znacznie więcej zdarzeń w miesiącu i mają znacznie większą przepustowość ruchu przychodzącego.
SKU (Numer jednostki magazynowej) | Liczba zdarzeń na miesiąc | Liczba zdarzeń na minutę | Rozmiar zdarzenia na minutę |
---|---|---|---|
S1 | 30 milionów | 720 | 720 KB |
S2 | 300 milionów | 7,200 | 7200 KB |
Limity nieruchomości
Limity właściwości Gen1 zależą od wybranego środowiska jednostki SKU. Podane właściwości zdarzenia mają odpowiednie kolumny JSON, CSV i wykres, które można wyświetlić w Azure Time Series Insights Explorer.
SKU | Maksymalna wartość właściwości |
---|---|
S1 | 600 właściwości (kolumny) |
S2 | 800 atrybutów (kolumny) |
Źródła zdarzeń
Obsługiwane są maksymalnie dwa źródła zdarzeń na wystąpienie.
- Dowiedz się, jak dodać centrum zdarzeń jako źródło.
- Skonfiguruj źródło centrum IoT .
Limity interfejsu API
Limity interfejsu API REST dla usługi Azure Time Series Insights Gen1 są określone w dokumentacji referencyjnej interfejsu API REST .
Planowanie środowiska
Drugi obszar, na którym należy się skoncentrować przy planowaniu środowiska usługi Azure Time Series Insights, to pojemność przyjmowania danych. Dzienna pamięć masowa przychodząca i pojemność na zdarzenia jest mierzona w przeliczeniu na minutę, w blokach po 1 KB. Maksymalny dozwolony rozmiar pakietu to 32 KB. Pakiety danych większe niż 32 KB są obcinane.
Pojemność jednostki SKU S1 lub S2 można zwiększyć do 10 jednostek w jednym środowisku. Nie można przeprowadzić migracji ze środowiska S1 do S2. Nie można przeprowadzić migracji ze środowiska S2 do S1.
W przypadku pojemności dla ruchu przychodzącego najpierw określ łączne zapotrzebowanie na ruch przychodzący na podstawie miesiąca. Następnie określ, jakie są twoje potrzeby na minutę.
Ograniczanie przepustowości i opóźnienia mają wpływ na wydajność na minutę. Jeśli wystąpi skok w danych przychodzących, który trwa mniej niż 24 godziny, usługa Azure Time Series Insights może "nadrobić zaległości" w tempie dwukrotnie wyższym niż w wcześniejszej tabeli.
Jeśli na przykład masz pojedynczą jednostkę SKU S1 i przetwarzasz dane z prędkością 720 zdarzeń na minutę, a szybkość danych wzrasta przez mniej niż jedną godzinę do 1440 zdarzeń lub mniej, nie ma zauważalnego opóźnienia w środowisku. Jeśli jednak przekroczysz 1440 zdarzeń na minutę przez więcej niż jedną godzinę, prawdopodobnie wystąpi opóźnienie w danych, które są wizualizowane i dostępne dla zapytań w środowisku.
Możesz nie wiedzieć z wyprzedzeniem, ile danych zamierzasz wysłać. W takim przypadku można znaleźć dane telemetryczne dla usługi Azure IoT Hub i azure Event Hubs w subskrypcji witryny Azure Portal. Dane telemetryczne mogą pomóc w ustaleniu, jak skonfigurować środowisko. Użyj okienka metryk w portalu Azure, aby wyświetlić dane telemetryczne dla odpowiedniego źródła zdarzeń. Jeśli rozumiesz metryki źródła zdarzeń, możesz efektywniej planować i aprowizować środowisko usługi Azure Time Series Insights.
Obliczanie wymagań dotyczących ruchu wejściowego
Aby obliczyć swoje wymagania wejściowe:
Sprawdź, czy pojemność ruchu przychodzącego przekracza średnią szybkość na minutę i czy środowisko jest wystarczająco duże, aby obsłużyć oczekiwany ruch przychodzący odpowiadający dwa razy większej pojemności przez mniej niż jedną godzinę.
Jeśli występują skoki ruchu przychodzącego, które trwają dłużej niż 1 godzinę, użyj częstotliwości tych skoków jako średniej. Udostępnij środowisko z wystarczającą pojemnością do obsługi nagłego wzrostu zapotrzebowania.
Łagodzenie ograniczania przepustowości i opóźnień
Aby uzyskać informacje na temat zapobiegania ograniczaniu przepustowości i opóźnieniu, przeczytaj Ograniczenia opóźnień i ograniczania przepustowości.
Kształtuj swoje wydarzenia
Ważne jest, aby upewnić się, że sposób wysyłania zdarzeń do usługi Azure Time Series Insights jest dostosowany do rozmiaru środowiska, które przygotowujesz. (Z drugiej strony można mapować rozmiar środowiska na liczbę zdarzeń odczytanych w usłudze Azure Time Series Insights i rozmiar każdego zdarzenia). Ważne jest również, aby rozważyć atrybuty, których można użyć do fragmentowania i filtrowania według podczas wykonywania zapytań dotyczących danych.
Napiwek
Zapoznaj się z dokumentacją kształtowania kodu JSON w Wysyłanie zdarzeń.
Upewnij się, że masz dane referencyjne
Zestaw danych referencyjnych to kolekcja elementów, które rozszerzają zdarzenia ze źródła zdarzeń. Silnik przetwarzania danych wejściowych usługi Azure Time Series Insights łączy każde zdarzenie ze źródła zdarzeń z odpowiednim wierszem w zestawie danych referencyjnych. Zdarzenie rozszerzone jest następnie dostępne do zapytań. Sprzężenie jest oparte na kolumnach klucza podstawowego zdefiniowanych w zestawie danych odniesienia.
Notatka
Dane referencyjne nie są przyłączone wstecznie. Tylko bieżące i przyszłe dane przychodzące są dopasowywane i dołączane do zestawu danych referencyjnych po ich skonfigurowaniu i przekazaniu. Jeśli planujesz wysłać dużą ilość danych historycznych do usługi Azure Time Series Insights i najpierw nie prześlesz ani nie utworzysz danych referencyjnych w usłudze Azure Time Series Insights, może się okazać, że będziesz musiał powtórzyć swoją pracę (podpowiedź: to nie jest frajda).
Aby dowiedzieć się więcej na temat tworzenia, przekazywania i zarządzania danymi referencyjnymi w usłudze Azure Time Series Insights, przeczytaj dokumentację zestawu danych referencyjnych .
Odzyskiwanie po awarii biznesowej
W tej sekcji opisano funkcje Azure Time Series Insights, które zapewniają działanie aplikacji i usług, nawet jeśli wystąpi katastrofa (znana jako odzyskiwanie po awarii biznesowej).
Wysoka dostępność
Jako usługa platformy Azure usługa Azure Time Series Insights zapewnia pewne funkcje wysokiej dostępności przy użyciu nadmiarowości na poziomie regionu świadczenia usługi Azure. Na przykład platforma Azure obsługuje możliwości odzyskiwania po awarii za pośrednictwem funkcji dostępności między regionami platformy Azure.
Dodatkowe funkcje zapewniające wysoką dostępność, które są udostępniane za pośrednictwem platformy Azure (a także dostępne dla dowolnego wystąpienia usługi Azure Time Series Insights), obejmują:
- awaria przełączania trybu: Platforma Azure udostępnia replikację geograficzną i równoważenie obciążenia.
- przywracanie danych i odzyskiwanie pamięci masowej : platforma Azure oferuje kilka opcji przywracania i odzyskiwania danych.
- usługi Azure Site Recovery: platforma Azure udostępnia funkcje odzyskiwania za pośrednictwem usługi Azure Site Recovery.
- usługa Azure Backup: Azure Backup obsługuje zarówno lokalne, jak i w chmurze kopie zapasowe maszyn wirtualnych Azure.
Upewnij się, że włączysz odpowiednie funkcje platformy Azure, aby zapewnić globalną wysoką dostępność między regionami dla urządzeń i użytkowników.
Notatka
Jeśli platforma Azure jest skonfigurowana do włączania dostępności między regionami, w usłudze Azure Time Series Insights nie jest wymagana żadna dodatkowa konfiguracja dostępności między regionami.
IoT i centra zdarzeń
Niektóre usługi Azure IoT obejmują również wbudowane funkcje odzyskiwania po awarii biznesowej:
- przywracanie po awarii w usłudze Azure IoT Hub o wysokiej dostępności, które obejmuje nadmiarowość regionalną.
- zasad usługi Azure Event Hubs
- Redundancja Azure Storage
Zintegrowanie usługi Azure Time Series Insights z innymi usługami zapewnia dodatkowe możliwości odzyskiwania po awarii. Na przykład dane telemetryczne wysyłane do centrum zdarzeń mogą być utrwalane w kopii zapasowej bazy danych usługi Azure Blob Storage.
Azure Time Series Insights (platforma do analizy szeregów czasowych)
Istnieje kilka sposobów utrzymania uruchomionych danych, aplikacji i usług usługi Azure Time Series Insights, nawet jeśli zostaną one zakłócone.
Można jednak określić, że wymagana jest również kompletna kopia zapasowa środowiska usługi Azure Time Series, w następujących celach:
- Jako instancja failover specjalnie dla usługi Azure Time Series Insights w celu przekierowania danych i ruchu do
- Aby zachować dane i informacje dotyczące inspekcji
Ogólnie rzecz biorąc, najlepszym sposobem duplikowania środowiska usługi Azure Time Series Insights jest utworzenie drugiego środowiska usługi Azure Time Series Insights w regionie kopii zapasowej platformy Azure. Zdarzenia są również wysyłane do tego środowiska pomocniczego z podstawowego źródła zdarzeń. Upewnij się, że używasz drugiej dedykowanej grupy odbiorców. Postępuj zgodnie z wcześniejszym opisem dotyczącym wytycznych do odzyskiwania po awarii biznesowej danego źródła.
Aby utworzyć zduplikowane środowisko:
- Utwórz środowisko w drugim regionie. Aby uzyskać więcej informacji, przeczytaj Tworzenie nowego środowiska usługi Azure Time Series Insights w witrynie Azure Portal.
- Utwórz drugą dedykowaną grupę odbiorców dla źródła zdarzeń.
- Połącz to źródło zdarzeń z nowym środowiskiem. Upewnij się, że wyznaczysz drugą dedykowaną grupę odbiorców.
- Zapoznaj się z dokumentacją usługi Azure Time Series Insights IoT Hub i Event Hubs.
Jeśli wystąpi zdarzenie:
- Jeśli region podstawowy jest dotknięty przez zdarzenie awarii, przekieruj operacje do zapasowego środowiska usługi Azure Time Series Insights.
- Ponieważ numery sekwencji koncentratora zaczynają się ponownie od 0 po przełączeniu awaryjnym, utwórz ponownie źródło zdarzeń w obu regionach/środowiskach z różnymi grupami konsumentów, aby uniknąć tworzenia zduplikowanych zdarzeń.
- Usuń źródło zdarzeń podstawowych, które jest teraz nieaktywne, aby zwolnić dostępne źródło zdarzeń dla danego środowiska. (Istnieje limit dwóch aktywnych źródeł zdarzeń w środowisku).
- Użyj drugiego regionu, aby utworzyć kopię zapasową i odzyskać wszystkie dane telemetryczne usługi Azure Time Series Insights i wysyłać zapytania o dane.
Ważny
Jeśli nastąpi przełączenie awaryjne:
- Może również wystąpić opóźnienie.
- Może wystąpić chwilowy skok przetwarzania komunikatów, ponieważ operacje są przekierowywane.
Aby uzyskać więcej informacji, przeczytaj Ograniczanie opóźnień w usłudze Azure Time Series Insights.
Następne kroki
Rozpocznij od utworzenia nowego środowiska usługi Azure Time Series Insights w portalu Azure.
Dowiedz się, jak dodać źródło zdarzeń Event Hubs do usługi Azure Time Series Insights.
Przeczytaj, jak skonfigurować źródło zdarzeń usługi IoT Hub.