IBM DB2 pureScale v Azure
Prostředí IBM DB2 pureScale poskytuje databázový cluster pro Azure s vysokou dostupností a škálovatelností v operačních systémech Linux. Tento článek ukazuje architekturu pro spouštění db2 pureScale v Azure.
Přehled
Podniky už dlouho používaly tradiční platformy pro správu relačních databází (RDBMS) k zajištění potřeb online zpracování transakcí (OLTP). V těchto dnech mnoho z nich migruje databázová prostředí založená na sálových počítačích do Azure jako způsob, jak rozšířit kapacitu, snížit náklady a udržovat stabilní strukturu provozních nákladů. Migrace je často prvním krokem při modernizaci starší platformy.
Podnikový zákazník nedávno hostil své prostředí IBM DB2 běžící na z/OS do IBM DB2 pureScale v Azure. Řešení databázového clusteru Db2 pureScale poskytuje vysokou dostupnost a škálovatelnost v operačních systémech Linux. Zákazník úspěšně spustil databázi Db2 jako samostatnou instanci vertikálního navýšení kapacity na jednom virtuálním počítači ve velkém systému vertikálního navýšení kapacity v Azure před instalací db2 pureScale.
I když není identické s původním prostředím, IBM DB2 pureScale v Linuxu poskytuje podobné funkce s vysokou dostupností a škálovatelností jako IBM DB2 pro z/OS běžící v konfiguraci Parallel Sysplex v sálovém počítači. V tomto scénáři je cluster připojený přes iSCSI ke sdílenému clusteru úložiště. Použili jsme systém souborů GlusterFS, bezplatný, škálovatelný opensourcový distribuovaný systém souborů optimalizovaný speciálně pro cloudové úložiště. IBM už ale toto řešení nepodporuje. Pokud chcete zachovat podporu od IBM, musíte použít podporovaný systém souborů kompatibilní s iSCSI. Microsoft nabízí jako možnost Prostory úložiště s přímým přístupem (S2D)
Tento článek popisuje architekturu použitou pro tuto migraci do Azure. Zákazník k otestování konfigurace použil Red Hat Linux 7.4. Tato verze je k dispozici na Azure Marketplace. Než zvolíte linuxovou distribuci, nezapomeňte ověřit aktuálně podporované verze. Podrobnosti najdete v dokumentaci pro IBM DB2 pureScale a GlusterFS.
Tento článek je výchozím bodem pro váš plán implementace DB2. Vaše obchodní požadavky se budou lišit, ale platí stejný základní vzor. Tento model architektury můžete použít také pro aplikace OLAP (Online Analytical Processing) v Azure.
Tento článek nepopisuje rozdíly a možné úlohy migrace pro přesun databáze IBM DB2 pro z/OS do IBM DB2 pureScale běžící v Linuxu. A neposkytuje odhady velikosti a analýzy úloh pro přechod z DB2 z/OS na DB2 pureScale.
Abychom vám pomohli rozhodnout se o nejlepší architektuře DB2 pureScale pro vaše prostředí, doporučujeme plně odhadnout velikost a vytvořit hypotézu. Ve zdrojovém systému nezapomeňte zvážit databázi DB2 z/OS Parallel Sysplex s architekturou sdílení dat, konfigurací zařízení pro párování a statistikou využití distribuovaných datových zařízení (DDF).
Poznámka:
Tento článek popisuje jeden přístup k migraci DB2, ale existují i jiné. Například DB2 pureScale může běžet také ve virtualizovaných místních prostředích. IBM podporuje DB2 v Microsoft Hyper-V v různých konfiguracích. Další informace naleznete v tématu DB2 pureScale virtualization architecture in the IBM Knowledge Center.
Architektura
Pokud chcete podporovat vysokou dostupnost a škálovatelnost v Azure, můžete pro db2 pureScale použít architekturu sdílených dat se škálováním na více instancí. Migrace zákazníka použila následující ukázkové architektury.
Diagram znázorňuje logické vrstvy potřebné pro cluster DB2 pureScale. Patří sem virtuální počítače pro klienta, pro správu, ukládání do mezipaměti, databázový stroj a sdílené úložiště.
Kromě uzlů databázového stroje diagram obsahuje dva uzly používané pro ukládání do mezipaměti clusteru (CFS). Pro samotný databázový stroj se používá minimálně dva uzly. Server DB2, který patří do clusteru pureScale, se nazývá člen.
Cluster je připojený přes iSCSI ke sdílenému úložnému clusteru se třemi uzly, aby poskytoval úložiště se škálováním na více systémů a vysokou dostupnost. Db2 pureScale je nainstalovaný na virtuálních počítačích Azure s Linuxem.
Tento přístup je šablona, kterou můžete upravit pro velikost a měřítko vaší organizace. Je založená na následujících materiálech:
Dva nebo více členů databáze se zkombinují s alespoň dvěma uzly CF. Uzly spravují globální fond vyrovnávacích pamětí (GBP) pro sdílené paměti a služby globálního správce zámků (GLM) za účelem řízení sdíleného přístupu a kolize uzamčení od aktivních členů. Jeden uzel CF funguje jako primární a druhý jako sekundární uzel CF s podporou převzetí služeb při selhání. Aby se zabránilo jedinému bodu selhání v prostředí, cluster DB2 pureScale vyžaduje alespoň čtyři uzly.
Vysoce výkonné sdílené úložiště (znázorněné ve velikosti P30 v diagramu) Každý uzel používá toto úložiště.
Vysoce výkonné sítě pro datové členy a sdílené úložiště.
Důležité informace o výpočetních prostředcích
Tato architektura spouští aplikační, úložiště a datové vrstvy na virtuálních počítačích Azure. Instalační skripty nasazení vytvoří následující:
Cluster DB2 pureScale. Typ výpočetních prostředků, které potřebujete v Azure, závisí na vašem nastavení. Obecně můžete použít dva přístupy:
Použijte síť ve stylu vysokovýkonné výpočetní prostředí (HPC) s více uzly, kde malé až střední instance přistupují ke sdílenému úložišti. Pro tento typ konfigurace prostředí HPC poskytují virtuální počítače řady L-series optimalizované pro paměť Azure nebo optimalizované pro úložiště potřebný výpočetní výkon.
Pro datové moduly používejte méně velkých instancí virtuálních počítačů. U velkých instancí jsou největší virtuální počítače M-series optimalizované pro paměť ideální pro úlohy náročné v paměti. V závislosti na velikosti logického oddílu (LPAR) používaného ke spuštění db2 může být potřeba vyhrazená instance.
DB2 CF používá virtuální počítače optimalizované pro paměť, například řady E-series nebo L-series.
Sdílený cluster úložiště, který používá Standard_DS4_v2 virtuální počítače s Linuxem.
Jumpbox pro správu je Standard_DS2_v2 virtuální počítač s Linuxem. Alternativou je Azure Bastion, služba, která poskytuje zabezpečené prostředí RDP/SSH pro všechny virtuální počítače ve vaší virtuální síti.
Klient je Standard_DS3_v2 virtuální počítač s Windows (používá se k testování).
Volitelné. Server s kopií clusteru. To je potřeba jenom s některými dřívějšími verzemi Db2 pureScale. Tento příklad používá Standard_DS3_v2 virtuální počítač s Linuxem (používá se pro DB2 pureScale).
Poznámka:
Cluster DB2 pureScale vyžaduje alespoň dvě instance DB2. Vyžaduje také instanci mezipaměti a instanci správce zámků.
Aspekty úložišť
Stejně jako Oracle RAC je databáze DB2 pureScale vysoce výkonnou databází v/V bloku se škálováním na více instancí. Doporučujeme použít největší možnost SSD úrovně Azure Premium, která vyhovuje vašim potřebám. Menší možnosti úložiště můžou být vhodné pro vývojová a testovací prostředí, zatímco produkční prostředí často potřebují větší kapacitu úložiště. Ukázková architektura využívá P30 kvůli poměru IOPS k velikosti a ceně. Bez ohledu na velikost používejte Službu Premium Storage pro zajištění nejlepšího výkonu.
DB2 pureScale používá architekturu se sdíleným obsahem, kde jsou všechna data přístupná ze všech uzlů clusteru. Služba Premium Storage musí být sdílena napříč několika instancemi, ať už na vyžádání, nebo na vyhrazených instancích.
Velký cluster DB2 pureScale může vyžadovat 200 terabajtů (TB) nebo více sdílených úložišť úrovně Premium s IOPS 100 000. DB2 pureScale podporuje blokové rozhraní iSCSI, které můžete použít v Azure. Rozhraní iSCSI vyžaduje sdílený cluster úložiště, který můžete implementovat pomocí S2D nebo jiného nástroje. Tento typ řešení vytvoří v Azure zařízení vSAN (Virtual Storage Area Network). DB2 pureScale používá síť vSAN k instalaci clusterového systému souborů, který se používá ke sdílení dat mezi virtuálními počítači.
Aspekty sítí
IBM doporučuje síť InfiniBand pro všechny členy v clusteru DB2 pureScale. DB2 pureScale také pro CFS používá vzdálený přímý přístup do paměti (RDMA), pokud je k dispozici.
Během instalace vytvoříte skupinu prostředků Azure, která bude obsahovat všechny virtuální počítače. Obecně platí, že prostředky seskupíte podle jejich životnosti a kdo je bude spravovat. Virtuální počítače v této architektuře vyžadují akcelerované síťové služby. Je to funkce Azure, která poskytuje konzistentní a ultra nízkou latenci sítě prostřednictvím virtualizace rozhraní SR-IOV (Single-Root I/O Virtualization) na virtuální počítač.
Každý virtuální počítač Azure se nasadí do virtuální sítě, která má podsítě: hlavní front-end Gluster FS (gfsfe), back-end gluster FS (bfsbe), DB2 pureScale (db2be) a front-end db2 pureScale (db2fe). Instalační skript také vytvoří primární síťové karty na virtuálních počítačích v hlavní podsíti.
Pomocí skupin zabezpečení sítě omezte síťový provoz ve virtuální síti a izolujte podsítě.
Db2 pureScale v Azure musí jako síťové připojení k úložišti používat protokol TCP/IP.