IBM DB2 pureScale na platformie Azure
Środowisko IBM DB2 pureScale zapewnia klaster baz danych dla platformy Azure o wysokiej dostępności i skalowalności w systemach operacyjnych Linux. W tym artykule przedstawiono architekturę uruchamiania bazy danych DB2 pureScale na platformie Azure.
Omówienie
Przedsiębiorstwa od dawna korzystają z tradycyjnych platform zarządzania relacyjnymi bazami danych (RDBMS), aby zaspokoić potrzeby przetwarzania transakcji online (OLTP). W dzisiejszych czasach wiele z nich migruje swoje środowiska baz danych oparte na komputerach mainframe na platformę Azure jako sposób na zwiększenie pojemności, zmniejszenie kosztów i utrzymanie stałej struktury kosztów operacyjnych. Migracja jest często pierwszym krokiem w modernizacji starszej platformy.
Ostatnio klient korporacyjny ponownie hostował swoje środowisko IBM DB2 działające w systemie z/OS do bazy danych IBM DB2 pureScale na platformie Azure. Rozwiązanie klastra bazy danych Db2 pureScale zapewnia wysoką dostępność i skalowalność w systemach operacyjnych Linux. Klient pomyślnie uruchomił bazę danych Db2 jako autonomiczne wystąpienie skalowane w górę na jednej maszynie wirtualnej w systemie o dużej skali na platformie Azure przed zainstalowaniem bazy danych Db2 pureScale.
Chociaż nie jest identyczne z oryginalnym środowiskiem, ibm DB2 pureScale w systemie Linux zapewnia podobne funkcje wysokiej dostępności i skalowalności, ponieważ ibm DB2 for z/OS działa w konfiguracji Parallel Sysplex na komputerze mainframe. W tym scenariuszu klaster jest połączony za pośrednictwem interfejsu iSCSI z udostępnionym klastrem magazynu. Użyliśmy systemu plików GlusterFS, bezpłatnego, skalowalnego rozproszonego systemu plików typu open source specjalnie zoptymalizowanego pod kątem magazynu w chmurze. Jednak firma IBM nie obsługuje już tego rozwiązania. Aby zapewnić obsługę firmy IBM, należy użyć obsługiwanego systemu plików zgodnego z interfejsem iSCSI. Firma Microsoft oferuje Miejsca do magazynowania Direct (S2D) jako opcję
W tym artykule opisano architekturę używaną na potrzeby tej migracji platformy Azure. Klient użył systemu Red Hat Linux 7.4 do przetestowania konfiguracji. Ta wersja jest dostępna w witrynie Azure Marketplace. Przed wybraniem dystrybucji systemu Linux upewnij się, że są sprawdzane obecnie obsługiwane wersje. Aby uzyskać szczegółowe informacje, zobacz dokumentację dotyczącą produktów IBM DB2 pureScale i GlusterFS.
Ten artykuł jest punktem wyjścia dla planu implementacji DB2. Wymagania biznesowe będą się różnić, ale ma zastosowanie ten sam podstawowy wzorzec. Możesz również użyć tego wzorca architektury dla aplikacji przetwarzania analitycznego online (OLAP) na platformie Azure.
W tym artykule nie omówiono różnic i możliwych zadań migracji do przenoszenia bazy danych IBM DB2 for z/OS do bazy danych IBM DB2 pureScale działającej w systemie Linux. Nie zapewnia również szacowania rozmiaru i analiz obciążeń na potrzeby przenoszenia z bazy danych DB2 z/OS do bazy danych DB2 pureScale.
Aby ułatwić podjęcie decyzji o najlepszej architekturze DB2 pureScale dla danego środowiska, zalecamy pełne oszacowanie rozmiaru i hipotezę. W systemie źródłowym należy wziąć pod uwagę architekturę równoległą db2 z/OS Parallel Sysplex z architekturą udostępniania danych, konfiguracją sprzężenia obiektu i statystykami użycia rozproszonego obiektu danych (DDF).
Uwaga
W tym artykule opisano jedno podejście do migracji bazy danych DB2, ale istnieją inne. Na przykład baza danych DB2 pureScale może być również uruchamiana w zwirtualizowanych środowiskach lokalnych. Firma IBM obsługuje bazę danych DB2 w funkcji Microsoft Hyper-V w różnych konfiguracjach. Aby uzyskać więcej informacji, zobacz Db2 pureScale virtualization architecture in the IBM Knowledge Center (Architektura wirtualizacji pureScale db2 w Centrum wiedzy IBM).
Architektura
Aby zapewnić wysoką dostępność i skalowalność na platformie Azure, możesz użyć architektury danych współużytkowanych skalowanych w poziomie dla bazy danych DB2 pureScale. Migracja klienta użyła następującej przykładowej architektury.
Na diagramie przedstawiono warstwy logiczne wymagane dla klastra db2 pureScale. Obejmują one maszyny wirtualne dla klienta, zarządzanie pamięcią podręczną, aparat bazy danych i magazyn udostępniony.
Oprócz węzłów aparatu bazy danych diagram zawiera dwa węzły używane do buforowania klastra (CFS). Aparat bazy danych używa co najmniej dwóch węzłów. Serwer DB2 należący do klastra pureScale jest nazywany elementem członkowskim.
Klaster jest połączony za pośrednictwem interfejsu iSCSI z klastrem magazynu współużytkowanego z trzema węzłami w celu zapewnienia magazynu skalowalnego w poziomie i wysokiej dostępności. Baza danych DB2 pureScale jest zainstalowana na maszynach wirtualnych platformy Azure z systemem Linux.
Takie podejście to szablon, który można zmodyfikować pod kątem rozmiaru i skali organizacji. Jest on oparty na następujących kwestiach:
Co najmniej dwa elementy członkowskie bazy danych są łączone z co najmniej dwoma węzłami CF. Węzły zarządzają globalną pulą (GBP) dla pamięci udostępnionej i usług globalnego menedżera blokady (GLM) w celu kontrolowania współdzielonego dostępu i blokowania rywalizacji z aktywnymi elementami członkowskimi. Jeden węzeł CF działa jako podstawowy, a drugi jako pomocniczy węzeł CF trybu failover. Aby uniknąć pojedynczego punktu awarii w środowisku, klaster DB2 pureScale wymaga co najmniej czterech węzłów.
Magazyn udostępniony o wysokiej wydajności (pokazany na rysunku rozmiar P30). Każdy węzeł używa tego magazynu.
Sieć o wysokiej wydajności dla składowych danych i magazynu udostępnionego.
Zagadnienia dotyczące obliczeń
Ta architektura uruchamia warstwy aplikacji, magazynu i danych na maszynach wirtualnych platformy Azure. Skrypty konfiguracji wdrożenia tworzą następujące elementy:
Klaster DB2 pureScale. Typ zasobów obliczeniowych potrzebnych na platformie Azure zależy od konfiguracji. Ogólnie rzecz biorąc, można użyć dwóch metod:
Użyj sieci w stylu obliczeń o wysokiej wydajności (HPC), w której małe i średnie wystąpienia uzyskują dostęp do magazynu udostępnionego. W przypadku tego typu konfiguracji HPC maszyny wirtualne serii E zoptymalizowane pod kątem pamięci platformy Azure lub zoptymalizowane pod kątem magazynu serii L zapewniają wymaganą moc obliczeniową.
Używaj mniej dużych wystąpień maszyn wirtualnych dla aparatów danych. W przypadku dużych wystąpień największe maszyny wirtualne serii M zoptymalizowane pod kątem pamięci są idealne dla dużych obciążeń w pamięci. Może być potrzebne dedykowane wystąpienie, w zależności od rozmiaru partycji logicznej (LPAR), która jest używana do uruchamiania bazy danych DB2.
Usługa DB2 CF korzysta z maszyn wirtualnych zoptymalizowanych pod kątem pamięci, takich jak seria E lub seria L.
Udostępniony klaster magazynu, który używa Standard_DS4_v2 maszyn wirtualnych z systemem Linux.
Serwer przesiadkowy zarządzania to maszyna wirtualna Standard_DS2_v2 z systemem Linux. Alternatywą jest usługa Azure Bastion, która zapewnia bezpieczne środowisko protokołu RDP/SSH dla wszystkich maszyn wirtualnych w sieci wirtualnej.
Klient jest Standard_DS3_v2 maszyną wirtualną z systemem Windows (używanym do testowania).
Opcjonalne. Serwer monitora. Jest to wymagane tylko w przypadku niektórych wcześniejszych wersji bazy danych Db2 pureScale. W tym przykładzie użyto Standard_DS3_v2 maszyny wirtualnej z systemem Linux (używanej dla bazy danych DB2 pureScale).
Uwaga
Klaster DB2 pureScale wymaga co najmniej dwóch wystąpień db2. Wymaga również wystąpienia pamięci podręcznej i wystąpienia menedżera blokady.
Zagadnienia dotyczące magazynu
Podobnie jak oracle RAC, baza danych DB2 pureScale to baza danych o wysokiej wydajności, skalowana w poziomie baza danych. Zalecamy użycie największej opcji ssd w warstwie Premium platformy Azure, która odpowiada Twoim potrzebom. Mniejsze opcje magazynowania mogą być odpowiednie dla środowisk programistycznych i testowych, podczas gdy środowiska produkcyjne często potrzebują większej pojemności magazynu. Przykładowa architektura używa P30 ze względu na stosunek liczby operacji we/wy na sekundę do rozmiaru i ceny. Niezależnie od rozmiaru, użyj usługi Premium Storage, aby uzyskać najlepszą wydajność.
Baza danych DB2 pureScale korzysta z architektury wszystkiego udostępnionego, gdzie wszystkie dane są dostępne ze wszystkich węzłów klastra. Magazyn w warstwie Premium musi być współużytkowany w wielu wystąpieniach— na żądanie lub na dedykowanych wystąpieniach.
Duży klaster DB2 pureScale może wymagać co najmniej 200 terabajtów (TB) magazynu udostępnionego w warstwie Premium z 100 000 operacji we/wy na sekundę. Baza danych DB2 pureScale obsługuje interfejs blokowy iSCSI, którego można używać na platformie Azure. Interfejs iSCSI wymaga udostępnionego klastra magazynu, który można zaimplementować za pomocą funkcji S2D lub innego narzędzia. Ten typ rozwiązania tworzy urządzenie wirtualnej sieci magazynowania (vSAN) na platformie Azure. Baza danych DB2 pureScale używa sieci vSAN do instalowania klastrowanego systemu plików używanego do udostępniania danych między maszynami wirtualnymi.
Zagadnienia dotyczące pracy w sieci
Firma IBM zaleca obsługę sieci InfiniBand dla wszystkich elementów członkowskich w klastrze DB2 pureScale. Db2 pureScale używa również zdalnego bezpośredniego dostępu do pamięci (RDMA), jeśli jest dostępny, dla plików CFs.
Podczas instalacji należy utworzyć grupę zasobów platformy Azure zawierającą wszystkie maszyny wirtualne. Ogólnie rzecz biorąc, grupujesz zasoby na podstawie ich okresu istnienia i kto będzie nimi zarządzać. Maszyny wirtualne w tej architekturze wymagają przyspieszonej sieci. Jest to funkcja platformy Azure, która zapewnia spójne, bardzo małe opóźnienie sieci za pośrednictwem wirtualizacji we/wy pojedynczego katalogu głównego (SR-IOV) do maszyny wirtualnej.
Każda maszyna wirtualna platformy Azure jest wdrażana w sieci wirtualnej, która ma podsieci: main, Gluster FS fronton (gfsfe), Gluster FS back end (bfsbe), DB2 pureScale (db2be) i DB2 pureScale fronton (db2fe). Skrypt instalacji tworzy również podstawowe karty sieciowe na maszynach wirtualnych w podsieci głównej.
Użyj sieciowych grup zabezpieczeń, aby ograniczyć ruch sieciowy w sieci wirtualnej i odizolować podsieci.
Na platformie Azure baza danych DB2 pureScale musi używać protokołu TCP/IP jako połączenia sieciowego dla magazynu.