Udostępnij za pośrednictwem


Zabezpieczenia, dostęp i operacje migracji teradata

Ten artykuł jest trzecią częścią siedmioczęściowej serii, która zawiera wskazówki dotyczące migracji z usługi Teradata do usługi Azure Synapse Analytics. Celem tego artykułu są najlepsze rozwiązania dotyczące operacji dostępu do zabezpieczeń.

Zagadnienia dotyczące zabezpieczeń

W tym artykule omówiono metody połączeń dla istniejących starszych środowisk Teradata oraz sposób ich migracji do usługi Azure Synapse Analytics z minimalnym ryzykiem i wpływem użytkowników.

W tym artykule przyjęto założenie, że istnieje wymóg migrowania istniejących metod połączenia i struktury użytkownika/roli/uprawnień zgodnie z oczekiwaniami. Jeśli nie, użyj witryny Azure Portal, aby utworzyć nowy system zabezpieczeń i zarządzać nim.

Aby uzyskać więcej informacji na temat opcji zabezpieczeń usługi Azure Synapse, zobacz Oficjalny dokument dotyczący zabezpieczeń.

Połączenie i uwierzytelnianie

Opcje autoryzacji teradata

Napiwek

Uwierzytelnianie zarówno w usługach Teradata, jak i Azure Synapse może być "w bazie danych" lub za pośrednictwem metod zewnętrznych.

Usługa Teradata obsługuje kilka mechanizmów nawiązywania połączenia i autoryzacji. Prawidłowe wartości mechanizmu to:

  • TD1, który wybiera teradata 1 jako mechanizm uwierzytelniania. Wymagana jest nazwa użytkownika i hasło.

  • TD2, który wybiera teradata 2 jako mechanizm uwierzytelniania. Wymagana jest nazwa użytkownika i hasło.

  • TDNEGO, który wybiera jeden z mechanizmów uwierzytelniania automatycznie na podstawie zasad, bez udziału użytkownika.

  • Ldap, który wybiera protokół LDAP (Lightweight Directory Access Protocol) jako mechanizm uwierzytelniania. Aplikacja udostępnia nazwę użytkownika i hasło.

  • KRB5, który wybiera kerberos (KRB5) na klientach systemu Windows pracujących z serwerami z systemem Windows. Aby zalogować się przy użyciu krB5, użytkownik musi podać domenę, nazwę użytkownika i hasło. Domena jest określana przez ustawienie nazwy użytkownika na MyUserName@MyDomain.

  • NTLM, który wybiera NTLM na klientach systemu Windows pracujących z serwerami z systemem Windows. Aplikacja udostępnia nazwę użytkownika i hasło.

Protokół Kerberos (KRB5), zgodność protokołu Kerberos (KRB5C), NT LAN Manager (NTLM) i Zgodność nt LAN Manager (NTLMC) są przeznaczone tylko dla systemu Windows.

Opcje autoryzacji usługi Azure Synapse

Usługa Azure Synapse obsługuje dwie podstawowe opcje połączenia i autoryzacji:

  • Uwierzytelnianie SQL: uwierzytelnianie SQL odbywa się za pośrednictwem połączenia z bazą danych, które zawiera identyfikator bazy danych, identyfikator użytkownika i hasło oraz inne parametry opcjonalne. Jest to funkcjonalnie równoważne połączeniom teradata TD1, TD2 i domyślnym.

  • Uwierzytelnianie firmy Microsoft Entra: za pomocą uwierzytelniania firmy Microsoft Entra można centralnie zarządzać tożsamościami użytkowników bazy danych i innymi usługi firmy Microsoft w jednej centralnej lokalizacji. Centralne zarządzanie identyfikatorami zapewnia jedno miejsce do zarządzania użytkownikami usługi SQL Data Warehouse i upraszcza zarządzanie uprawnieniami. Identyfikator Entra firmy Microsoft może również obsługiwać połączenia z usługami LDAP i Kerberos — na przykład identyfikator Entra firmy Microsoft może służyć do nawiązywania połączenia z istniejącymi katalogami LDAP, jeśli mają one pozostać w miejscu po migracji bazy danych.

Użytkownicy, role i uprawnienia

Omówienie

Napiwek

Planowanie wysokiego poziomu jest niezbędne dla pomyślnego projektu migracji.

Zarówno Teradata, jak i Azure Synapse implementują kontrolę dostępu do bazy danych za pośrednictwem kombinacji użytkowników, ról i uprawnień. Obie metody używają standardowego języka SQL CREATE USER i CREATE ROLE instrukcji do definiowania użytkowników i ról oraz GRANT REVOKE instrukcji w celu przypisywania lub usuwania uprawnień do tych użytkowników i/lub ról.

Napiwek

Automatyzacja procesów migracji jest zalecana, aby skrócić czas i zakres błędów.

Koncepcyjnie dwie bazy danych są podobne i może być możliwe zautomatyzowanie migracji istniejących identyfikatorów użytkowników, ról i uprawnień do pewnego stopnia. Przeprowadź migrację takich danych, wyodrębniając istniejące informacje o starszej wersji użytkownika i roli z tabel katalogu systemu Teradata i generując pasujące równoważne CREATE USER instrukcje i CREATE ROLE uruchamiane w usłudze Azure Synapse w celu ponownego utworzenia tej samej hierarchii użytkownika/roli.

Po wyodrębnieniu danych użyj tabel wykazu systemu Teradata, aby wygenerować równoważne GRANT instrukcje w celu przypisania uprawnień (gdzie istnieje odpowiednik). Na poniższym diagramie pokazano, jak używać istniejących metadanych do generowania niezbędnego kodu SQL.

Wykres przedstawiający sposób automatyzowania migracji uprawnień z istniejącego systemu.

Użytkownicy i role

Napiwek

Migracja magazynu danych wymaga więcej niż tylko tabel, widoków i instrukcji SQL.

Informacje o bieżących użytkownikach i rolach w systemie Teradata znajdują się w tabelach DBC.USERS katalogu systemu (lub DBC.DATABASES) i DBC.ROLEMEMBERS. Wykonaj zapytanie dotyczące tych tabel (jeśli użytkownik ma SELECT dostęp do tych tabel), aby uzyskać bieżące listy użytkowników i ról zdefiniowanych w systemie. Poniżej przedstawiono przykłady zapytań, które należy wykonać dla poszczególnych użytkowników:

/***SQL to find all users***/
SELECT
DatabaseName AS UserName
FROM DBC.Databases
WHERE dbkind = 'u';

/***SQL to find all roles***/
SELECT A.ROLENAME, A.GRANTEE, A.GRANTOR,
  A.DefaultRole, 
  A.WithAdmin,
  B.DATABASENAME, 
  B.TABLENAME,
  B.COLUMNNAME, 
  B.GRANTORNAME,
  B.AccessRight
FROM DBC.ROLEMEMBERS A 
JOIN DBC.ALLROLERIGHTS B 
ON A.ROLENAME = B.ROLENAME 
GROUP BY 1,2,3,4,5,6,7
ORDER BY 2,1,6;

Te przykłady modyfikują instrukcje SELECT , aby wygenerować zestaw wyników, który jest serią instrukcji CREATE USER i CREATE ROLE , uwzględniając odpowiedni tekst jako literał w instrukcji SELECT .

Nie ma możliwości pobrania istniejących haseł, dlatego należy zaimplementować schemat przydzielania nowych haseł początkowych w usłudze Azure Synapse.

Uprawnienia

Napiwek

Istnieją równoważne uprawnienia usługi Azure Synapse dla podstawowych operacji bazy danych, takich jak DML i DDL.

W systemie Teradata tabele DBC.ALLRIGHTS systemowe i DBC.ALLROLERIGHTS przechowują prawa dostępu dla użytkowników i ról. Wykonaj zapytanie względem tych tabel (jeśli użytkownik ma SELECT dostęp do tych tabel), aby uzyskać bieżące listy praw dostępu zdefiniowanych w systemie. Poniżej przedstawiono przykłady zapytań dla poszczególnych użytkowników:

/**SQL for AccessRights held by a USER***/
SELECT UserName, DatabaseName,TableName,ColumnName,
CASE WHEN Abbv.AccessRight IS NOT NULL THEN Abbv.Description ELSE 
ALRTS.AccessRight
END AS AccessRight, GrantAuthority, GrantorName, AllnessFlag, CreatorName, CreateTimeStamp
FROM DBC.ALLRIGHTS ALRTS LEFT OUTER JOIN AccessRightsAbbv Abbv
ON ALRTS.AccessRight = Abbv.AccessRight 
WHERE UserName='UserXYZ'
Order By 2,3,4,5;

/**SQL for AccessRights held by a ROLE***/
SELECT RoleName, DatabaseName,TableName,ColumnName,
CASE WHEN Abbv.AccessRight IS NOT NULL THEN Abbv.Description ELSE 
ALRTS.AccessRight
END AS AccessRight, GrantorName, CreateTimeStamp
FROM DBC.ALLROLERIGHTS ALRTS LEFT OUTER JOIN AccessRightsAbbv
Abbv
ON ALRTS.AccessRight = Abbv.AccessRight 
WHERE RoleName='BI_DEVELOPER'
Order By 2,3,4,5;

Zmodyfikuj te przykładowe SELECT instrukcje, aby utworzyć zestaw wyników, który jest serią instrukcji GRANT , uwzględniając odpowiedni tekst jako literał w instrukcji SELECT .

Użyj tabeli AccessRightsAbbv , aby wyszukać pełny tekst prawa dostępu, ponieważ klucz sprzężenia jest skróconym polem "type". Poniższa tabela zawiera listę praw dostępu teradata i ich odpowiedników w usłudze Azure Synapse.

Nazwa uprawnienia teradata Typ teradata Odpowiednik usługi Azure Synapse
PRZERWANIE SESJI AS ZABIJ POŁĄCZENIE Z BAZĄ DANYCH
ALTER EXTERNAL PROCEDURE AE 4
ALTER, FUNKCJA AF ALTER, FUNKCJA
ALTER PROCEDURE AP ALTER PROCEDURE
PUNKT KONTROLNY CP PUNKT KONTROLNY
TWORZENIE AUTORYZACJI CA CREATE LOGIN
CREATE DATABASE CD CREATE DATABASE
TWORZENIE PROCEDURY ZEWNĘTRZNEJ CE 4
CREATE FUNCTION CF CREATE FUNCTION
TWORZENIE BIBLIOTEKI GLOP GC 3
TWORZENIE MAKRA Chassis Manager (CM) TWORZENIE PROCEDURY 2
TWORZENIE PROCEDURY WŁAŚCICIELA OP TWORZENIE PROCEDURY
TWORZENIE PROCEDURY PC TWORZENIE PROCEDURY
TWORZENIE PROFILU CO TWORZENIE IDENTYFIKATORA LOGOWANIA 1
TWORZENIE ROLI CR TWORZENIE ROLI
DROP DATABASE DD DROP DATABASE
DROP FUNCTION DF DROP FUNCTION
DROP GLOP GD 3
UPUŚĆ MAKRO DM PROCEDURA UPUSZCZANIA 2
PROCEDURA UPUSZCZANIA PD PROCEDURA USUWANIA
UPUŚĆ PROFIL DO DROP LOGIN 1
UPUŚĆ ROLĘ DR USUWANIE ROLI
DROP TABLE DT DROP TABLE
WYZWALACZ DROP DG 3
UPUŚĆ UŻYTKOWNIKA DU UPUŚĆ UŻYTKOWNIKA
DROP VIEW DV DROP VIEW
WYSYPISKO DP 4
WYKONAĆ E WYKONAJ
EXECUTE, FUNKCJA EF WYKONAJ
PROCEDURA WYKONYWANIA PE WYKONAJ
CZŁONEK GLOP GM 3
INDEKS IX CREATE INDEX
INSERT I INSERT
MONRESOURCE MR 5
MONSESSION RN 5
PRZESŁOŃ OGRANICZENIE ZRZUTU OA 4
PRZESŁOŃ OGRANICZENIE PRZYWRACANIA LUB 4
ODWOŁANIA RF DOKUMENTACJA
REPLCONTROL RO 5
PRZYWRÓCIĆ OS 4
SELECT R SELECT
SETRESRATE SR 5
SETESSRATE SS 5
POKAZAĆ SH 3
UPDATE U UPDATE

AccessRightsAbbv uwagi dotyczące tabeli:

  1. Teradata PROFILE jest funkcjonalnie równoważne LOGIN w usłudze Azure Synapse.

  2. W poniższej tabeli przedstawiono podsumowanie różnic między makrami a procedurami składowanymi w usłudze Teradata. W usłudze Azure Synapse procedury zapewniają funkcjonalność opisaną w tabeli.

    Makro Procedura składowana
    Zawiera sql Zawiera sql
    Może zawierać polecenia BTEQ dot Zawiera kompleksową usługę SPL
    Może odbierać przekazane do niego wartości parametrów Może odbierać przekazane do niego wartości parametrów
    Może pobrać co najmniej jeden wiersz Aby pobrać więcej niż jeden wiersz, należy użyć kursora
    Przechowywane w przestrzeni PERM bazy danych DBC Przechowywane w BAZIE DANYCH lub PERM UŻYTKOWNIKA
    Zwraca wiersze do klienta Może zwrócić co najmniej jedną wartość do klienta jako parametry
  3. SHOW, GLOPi TRIGGER nie mają bezpośredniego odpowiednika w usłudze Azure Synapse.

  4. Te funkcje są zarządzane automatycznie przez system w usłudze Azure Synapse. Zobacz Zagadnienia operacyjne.

  5. W usłudze Azure Synapse te funkcje są obsługiwane poza bazą danych.

Aby uzyskać więcej informacji na temat praw dostępu w usłudze Azure Synapse, zobacz Uprawnienia zabezpieczeń usługi Azure Synapse Analytics.

Zagadnienia operacyjne

Napiwek

Zadania operacyjne są niezbędne do wydajnego działania magazynu danych.

W tej sekcji omówiono sposób implementowania typowych zadań operacyjnych Teradata w usłudze Azure Synapse z minimalnym ryzykiem i wpływem na użytkowników.

Podobnie jak w przypadku wszystkich produktów magazynu danych, gdy w środowisku produkcyjnym istnieją bieżące zadania zarządzania, które są niezbędne do wydajnego działania systemu i zapewnienia danych na potrzeby monitorowania i inspekcji. Wykorzystanie zasobów i planowanie pojemności na potrzeby przyszłego wzrostu również należy do tej kategorii, podobnie jak tworzenie kopii zapasowych/przywracanie danych.

Chociaż koncepcyjnie zadania związane z zarządzaniem i operacjami dla różnych magazynów danych są podobne, poszczególne implementacje mogą się różnić. Ogólnie rzecz biorąc, nowoczesne produkty oparte na chmurze, takie jak Azure Synapse, mają tendencję do uwzględnienia bardziej zautomatyzowanego i "zarządzanego przez system" podejścia (w przeciwieństwie do bardziej "ręcznego" podejścia w starszych magazynach danych, takich jak Teradata).

W poniższych sekcjach porównaliśmy opcje Teradata i Azure Synapse dla różnych zadań operacyjnych.

Zadania sprzątania

Napiwek

Zadania utrzymania domu umożliwiają wydajne działanie magazynu produkcyjnego i optymalizowanie wykorzystania zasobów, takich jak magazyn.

W większości starszych środowisk magazynu danych istnieje wymóg regularnego wykonywania zadań "utrzymania domu", takich jak odzyskiwanie miejsca do magazynowania dysku, które można zwolnić przez usunięcie starych wersji zaktualizowanych lub usuniętych wierszy albo reorganizację plików dziennika danych lub bloków indeksu w celu zapewnienia wydajności. Zbieranie statystyk jest również potencjalnie czasochłonnym zadaniem. Zbieranie statystyk jest wymagane po pozyskiwaniu zbiorczych danych w celu zapewnienia optymalizatora zapytań aktualnych danych do bazowej generacji planów wykonywania zapytań.

Teradata zaleca zbieranie statystyk w następujący sposób:

  • Zbierz statystyki dotyczące niepopulatowanych tabel, aby skonfigurować histogram interwału używany w przetwarzaniu wewnętrznym. Ta początkowa kolekcja sprawia, że kolejne kolekcje statystyk są szybsze. Pamiętaj, aby ponownie tworzyć statystyki po dodaniu danych.

  • Zbieranie statystyk fazy prototypu dla nowo wypełnionych tabel.

  • Zbierz statystyki fazy produkcji po znacznej wartości procentowej zmiany tabeli lub partycji (ok. 10% wierszy). W przypadku dużych ilości wartości niepowiązanych, takich jak daty lub znaczniki czasu, korzystne może być ponowne zbieranie na poziomie 7%.

  • Zbierz statystyki fazy produkcji po utworzeniu użytkowników i zastosowaniu rzeczywistych obciążeń zapytań do bazy danych (do około trzech miesięcy wykonywania zapytań).

  • Zbierz statystyki w ciągu pierwszych kilku tygodni po uaktualnieniu lub migracji w okresach niskiego wykorzystania procesora CPU.

Zbieranie statystyk można zarządzać ręcznie przy użyciu otwartych interfejsów API zarządzania statystykami automatycznymi lub automatycznie przy użyciu portletu Programu Teradata Viewpoint Stats Manager.

Napiwek

Automatyzowanie i monitorowanie zadań utrzymywania domu na platformie Azure.

Baza danych Teradata zawiera wiele tabel dzienników w słowniku danych, które gromadzą dane automatycznie lub po włączeniu niektórych funkcji. Ponieważ dane dziennika rosną wraz z upływem czasu, przeczyść starsze informacje, aby uniknąć używania stałego miejsca. Dostępne są opcje automatyzacji konserwacji tych dzienników. Tabele słownika Teradata, które wymagają konserwacji, zostaną omówione w następnej kolejności.

Tabele słowników do obsługi

Resetuj akumulatory i wartości szczytowe przy użyciu DBC.AMPUsage widoku i ClearPeakDisk makra dostarczonego z oprogramowaniem:

  • DBC.Acctg: użycie zasobów według konta/użytkownika

  • DBC.DataBaseSpace: ewidencjonowanie przestrzeni bazy danych i tabel

Teradata automatycznie utrzymuje te tabele, ale dobre rozwiązania mogą zmniejszyć ich rozmiar:

  • DBC.AccessRights: prawa użytkownika do obiektów

  • DBC.RoleGrants: prawa roli do obiektów

  • DBC.Roles: zdefiniowane role

  • DBC.Accounts: kody kont według użytkownika

Zarchiwizuj te tabele rejestrowania (w razie potrzeby) i przeczyść informacje 60–90 dni. Przechowywanie zależy od wymagań klienta:

  • DBC.SW_Event_Log: dziennik konsoli bazy danych

  • DBC.ResUsage: tabele monitorowania zasobów

  • DBC.EventLog: historia logowania/wylogowania sesji

  • DBC.AccLogTbl: zarejestrowane zdarzenia użytkownika/obiektu

  • DBC.DBQL tables: zarejestrowane działanie użytkownika/sql

  • .NETSecPolicyLogTbl: rejestruje dzienniki dzienników inspekcji zasad zabezpieczeń dynamicznych

  • .NETSecPolicyLogRuleTbl: kontroluje, kiedy i jak są rejestrowane dynamiczne zasady zabezpieczeń

Przeczyść te tabele, gdy skojarzony nośnik wymienny wygasł i zastąpiony:

  • DBC.RCEvent: zdarzenia archiwum/odzyskiwania

  • DBC.RCConfiguration: konfiguracja archiwum/odzyskiwania

  • DBC.RCMedia: VolSerial do archiwizacji/odzyskiwania

Usługa Azure Synapse ma możliwość automatycznego tworzenia statystyk, dzięki czemu mogą być używane zgodnie z potrzebami. Wykonaj defragmentację indeksów i bloków danych ręcznie, zgodnie z harmonogramem lub automatycznie. Wykorzystanie natywnych wbudowanych funkcji platformy Azure może zmniejszyć nakład pracy wymagany w ćwiczeniu migracji.

Monitorowanie i inspekcja

Napiwek

W czasie zaimplementowano kilka różnych narzędzi w celu umożliwienia monitorowania i rejestrowania systemów Teradata.

Teradata udostępnia kilka narzędzi do monitorowania operacji, w tym Teradata Viewpoint i Ecosystem Manager. W przypadku historii zapytań rejestrowania dziennik zapytań bazy danych (DBQL) to funkcja bazy danych Teradata, która udostępnia szereg wstępnie zdefiniowanych tabel, które mogą przechowywać historyczne rekordy zapytań oraz ich czas trwania, wydajność i działanie docelowe na podstawie reguł zdefiniowanych przez użytkownika.

Administratorzy baz danych mogą używać widoku teradata do określania stanu systemu, trendów i stanu poszczególnych zapytań. Obserwując trendy w zakresie użycia systemu, administratorzy systemu mogą lepiej planować implementacje projektów, zadania wsadowe i konserwację, aby uniknąć okresów szczytowych użycia. Użytkownicy biznesowi mogą używać widoku teradata, aby szybko uzyskać dostęp do stanu raportów i zapytań oraz przejść do szczegółów.

Napiwek

Witryna Azure Portal udostępnia interfejs użytkownika do zarządzania zadaniami monitorowania i inspekcji dla wszystkich danych i procesów platformy Azure.

Podobnie usługa Azure Synapse udostępnia zaawansowane środowisko monitorowania w witrynie Azure Portal, aby zapewnić wgląd w obciążenie magazynu danych. Witryna Azure Portal jest zalecanym narzędziem do monitorowania magazynu danych, ponieważ zapewnia konfigurowalne okresy przechowywania, alerty, zalecenia i dostosowywalne wykresy i pulpity nawigacyjne dla metryk i dzienników.

Portal umożliwia również integrację z innymi usługami monitorowania platformy Azure, takimi jak Operations Management Suite (OMS) i Azure Monitor (dzienniki), aby zapewnić całościowe środowisko monitorowania nie tylko dla magazynu danych, ale także całej platformy analizy Azure na potrzeby zintegrowanego środowiska monitorowania.

Napiwek

Metryki niskiego poziomu i całego systemu są automatycznie rejestrowane w usłudze Azure Synapse.

Statystyki wykorzystania zasobów dla usługi Azure Synapse są automatycznie rejestrowane w systemie. Metryki dla każdego zapytania obejmują statystyki użycia procesora CPU, pamięci, pamięci podręcznej, operacji we/wy i tymczasowego obszaru roboczego, a także informacje o łączności, takie jak nieudane próby połączenia.

Usługa Azure Synapse udostępnia zestaw dynamicznych widoków zarządzania (DMV). Te widoki są przydatne podczas aktywnego rozwiązywania problemów i identyfikowania wąskich gardeł wydajności w obciążeniu.

Aby uzyskać więcej informacji, zobacz Azure Synapse operations and management options (Operacje i opcje zarządzania w usłudze Azure Synapse).

Wysoka dostępność (HA) i odzyskiwanie po awarii (DR)

Teradata implementuje funkcje, takie jak FALLBACK, narzędzie do przywracania archiwum (ARC) i architektura strumienia danych (DSA), aby zapewnić ochronę przed utratą danych i wysoką dostępnością za pośrednictwem replikacji i archiwizacji danych. Opcje odzyskiwania po awarii obejmują podwójne aktywne rozwiązanie, odzyskiwanie po awarii jako usługę lub system zastępczy w zależności od wymagania dotyczącego czasu odzyskiwania.

Napiwek

Usługa Azure Synapse automatycznie tworzy migawki w celu zapewnienia szybkiego czasu odzyskiwania.

Usługa Azure Synapse używa migawek baz danych w celu zapewnienia wysokiej dostępności magazynu. Migawka magazynu danych tworzy punkt przywracania, którego można użyć do odzyskania lub skopiowania magazynu danych do poprzedniego stanu. Ponieważ usługa Azure Synapse jest systemem rozproszonym, migawka magazynu danych składa się z wielu plików, które znajdują się w usłudze Azure Storage. Migawki przechwytują przyrostowe zmiany danych przechowywanych w magazynie danych.

Usługa Azure Synapse automatycznie tworzy migawki przez cały dzień, tworząc punkty przywracania, które są dostępne przez siedem dni. Nie można zmienić tego okresu przechowywania. Usługa Azure Synapse obsługuje ośmiogodzinny cel punktu odzyskiwania (RPO). Magazyn danych można przywrócić w regionie podstawowym z dowolnej migawki wykonanej w ciągu ostatnich siedmiu dni.

Napiwek

Użyj migawek zdefiniowanych przez użytkownika, aby zdefiniować punkt odzyskiwania przed aktualizacjami klucza.

Obsługiwane są również punkty przywracania zdefiniowane przez użytkownika, co umożliwia ręczne wyzwalanie migawek w celu utworzenia punktów przywracania magazynu danych przed dużymi modyfikacjami. Ta funkcja gwarantuje, że punkty przywracania są logicznie spójne, co zapewnia dodatkową ochronę danych w przypadku przerw w obciążeniu lub błędów użytkownika dla żądanego celu punktu odzyskiwania krótszego niż 8 godzin.

Napiwek

Platforma Microsoft Azure udostępnia automatyczne kopie zapasowe do oddzielnej lokalizacji geograficznej w celu włączenia odzyskiwania po awarii.

Oprócz opisanych wcześniej migawek usługa Azure Synapse również wykonuje standardowa geograficzną kopię zapasową raz dziennie w sparowanym centrum danych. Cel punktu odzyskiwania dla przywracania geograficznego wynosi 24 godziny. Możesz przywrócić geograficzną kopię zapasową na serwer w dowolnym innym regionie, w którym jest obsługiwana usługa Azure Synapse. Geograficzna kopia zapasowa gwarantuje, że magazyn danych można przywrócić w przypadku niedostępności punktów przywracania w regionie podstawowym.

Zarządzanie obciążeniami

Napiwek

W magazynie danych produkcyjnych zwykle występują mieszane obciążenia z różnymi charakterystykami użycia zasobów uruchomionymi współbieżnie.

Obciążenie to klasa żądań bazy danych o typowych cechach, których dostęp do bazy danych można zarządzać za pomocą zestawu reguł. Obciążenia są przydatne w następujących celach:

  • Ustawianie różnych priorytetów dostępu dla różnych typów żądań.

  • Monitorowanie wzorców użycia zasobów, dostrajanie wydajności i planowanie pojemności.

  • Ograniczenie liczby żądań lub sesji, które mogą być uruchamiane w tym samym czasie.

W systemie Teradata zarządzanie obciążeniami jest działaniem zarządzania wydajnością obciążenia przez monitorowanie aktywności systemu i działanie w przypadku osiągnięcia wstępnie zdefiniowanych limitów. Zarządzanie obciążeniami używa reguł, a każda reguła ma zastosowanie tylko do niektórych żądań bazy danych. Jednak kolekcja wszystkich reguł ma zastosowanie do wszystkich aktywnych prac na platformie. Usługa Teradata Active System Management (TASM) wykonuje pełne zarządzanie obciążeniami w bazie danych Teradata Database.

W usłudze Azure Synapse klasy zasobów są wstępnie określonymi limitami zasobów, które zarządzają zasobami obliczeniowymi i współbieżnością na potrzeby wykonywania zapytań. Klasy zasobów mogą ułatwić zarządzanie obciążeniem, ustawiając limity liczby zapytań uruchamianych współbieżnie i zasobów obliczeniowych przypisanych do każdego zapytania. Istnieje kompromis między pamięcią a współbieżnością.

Usługa Azure Synapse automatycznie rejestruje statystyki wykorzystania zasobów. Metryki obejmują statystyki użycia procesora CPU, pamięci, pamięci podręcznej, operacji we/wy i tymczasowego obszaru roboczego dla każdego zapytania. Usługa Azure Synapse rejestruje również informacje o łączności, takie jak nieudane próby połączenia.

Napiwek

Metryki niskiego poziomu i całego systemu są automatycznie rejestrowane na platformie Azure.

Usługa Azure Synapse obsługuje następujące podstawowe pojęcia dotyczące zarządzania obciążeniami:

  • Klasyfikacja obciążeń: możesz przypisać żądanie do grupy obciążeń w celu ustawienia poziomów ważności.

  • Ważność obciążenia: możesz wpływać na kolejność, w jakiej żądanie uzyskuje dostęp do zasobów. Domyślnie zapytania są zwalniane z kolejki w pierwszej kolejności, gdy zasoby stają się dostępne. Ważność obciążenia umożliwia wykonywanie zapytań o wyższym priorytcie natychmiast odbierać zasoby niezależnie od kolejki.

  • Izolacja obciążenia: możesz zarezerwować zasoby dla grupy obciążeń, przypisać maksymalne i minimalne użycie dla różnych zasobów, ograniczyć zasoby, z których może korzystać grupa żądań, i ustawić wartość limitu czasu, aby automatycznie zabić zapytania uruchamiania.

Uruchamianie mieszanych obciążeń może stanowić wyzwanie dla zasobów w systemach zajętych. Pomyślny schemat zarządzania obciążeniami skutecznie zarządza zasobami, zapewnia wysoce wydajne wykorzystanie zasobów i maksymalizuje zwrot z inwestycji (ROI). Klasyfikacja obciążeń, ważność obciążenia i izolacja obciążenia zapewnia większą kontrolę nad sposobem korzystania z zasobów systemowych przez obciążenie.

W przewodniku zarządzania obciążeniami opisano techniki analizowania obciążenia, zarządzania i monitorowania ważności obciążenia](.. /.. /sql-data-warehouse/sql-data-warehouse-how-to-manage-and-monitor-workload-importance.md) oraz kroki konwertowania klasy zasobów na grupę obciążeń. Użyj witryny Azure Portal i zapytań T-SQL w widokach DMV, aby monitorować obciążenie w celu zapewnienia efektywnego wykorzystania odpowiednich zasobów. Usługa Azure Synapse udostępnia zestaw dynamicznych widoków zarządzania (DMV) do monitorowania wszystkich aspektów zarządzania obciążeniami. Te widoki są przydatne podczas aktywnego rozwiązywania problemów i identyfikowania wąskich gardeł wydajności w obciążeniu.

Te informacje mogą być również używane do planowania pojemności, określania zasobów wymaganych dla dodatkowych użytkowników lub obciążeń aplikacji. Dotyczy to również planowania skalowania w górę/w dół zasobów obliczeniowych w celu ekonomicznego wsparcia obciążeń "szczytowych".

Aby uzyskać więcej informacji na temat zarządzania obciążeniami w usłudze Azure Synapse, zobacz Zarządzanie obciążeniami przy użyciu klas zasobów.

Skalowanie zasobów obliczeniowych

Napiwek

Główną zaletą platformy Azure jest możliwość niezależnego skalowania zasobów obliczeniowych w górę i w dół na żądanie w celu efektywnego obsługi obciążeń szczytowych.

Architektura usługi Azure Synapse oddziela magazyn i zasoby obliczeniowe, co pozwala na niezależne skalowanie każdego z nich. W związku z tym zasoby obliczeniowe można skalować w celu spełnienia wymagań dotyczących wydajności niezależnie od magazynu danych. Można również wstrzymywać i wznawiać działanie zasobów obliczeniowych. Naturalną zaletą tej architektury jest to, że rozliczenia dla zasobów obliczeniowych i magazynu są oddzielne. Jeśli magazyn danych nie jest używany, możesz zaoszczędzić na kosztach obliczeń, wstrzymując obliczenia.

Zasoby obliczeniowe można skalować w górę lub skalować z powrotem, dostosowując ustawienie jednostek magazynu danych dla magazynu danych. Wydajność ładowania i wykonywania zapytań zwiększa się liniowo w miarę dodawania większej liczby jednostek magazynu danych.

Dodanie większej liczby węzłów obliczeniowych zwiększa moc obliczeniową i możliwość korzystania z bardziej przetwarzania równoległego. Wraz ze wzrostem liczby węzłów obliczeniowych liczba dystrybucji na węzeł obliczeniowy zmniejsza się, zapewniając większą moc obliczeniową i przetwarzanie równoległe zapytań. Podobnie zmniejszenie liczby jednostek magazynu danych zmniejsza liczbę węzłów obliczeniowych, co zmniejsza zasoby obliczeniowe zapytań.

Następne kroki

Aby dowiedzieć się więcej na temat wizualizacji i raportowania, zobacz następny artykuł z tej serii: Wizualizacja i raportowanie migracji teradata.