Azure의 IBM DB2 pureScale
IBM DB2 pureScale 환경은 Linux 운영 체제에서 Azure용 데이터베이스 클러스터에 고가용성 및 확장성을 제공합니다. 이 문서에서는 Azure에서 DB2 pureScale를 실행하기 위한 아키텍처를 보여 줍니다.
개요
기업은 오랫동안 기존의 RDBMS(관계형 데이터베이스 관리 시스템) 플랫폼을 사용하여 OLTP(온라인 트랜잭션 처리) 요구를 충족했습니다. 요즘에는 많은 기업들이 용량을 확장하고, 비용을 절감하고, 안정적인 운영 비용 구조를 유지 관리하기 위한 방법으로 메인프레임 기반 데이터베이스 환경을 Azure로 마이그레이션하고 있습니다. 종종 마이그레이션은 기존 플랫폼을 현대화하는 첫 번째 단계로 사용됩니다.
엔터프라이즈 고객은 최근에 z/OS에서 실행되는 IBM DB2 환경을 Azure의 IBM DB2 pureScale로 다시 호스트했습니다. DB2 pureScale 데이터베이스 클러스터 솔루션은 Linux 운영 체제에 고가용성 및 확장성을 제공합니다. 고객은 DB2 pureScale을 설치하기 전에 Azure 기반 대규모 스케일업 시스템의 단일 VM(가상 머신)에서 독립 실행형 스케일업 인스턴스로 Db2를 성공적으로 실행했습니다.
원본 환경과 동일하지 않더라도, Linux의 IBM DB2 pureScale은 메인프레임의 병렬 Sysplex 구성에서 실행되는 z/OS용 IBM DB2와 비슷한 고가용성 및 확장성 기능을 제공합니다. 이 시나리오에서 클러스터는 iSCSI를 통해 공유 스토리지 클러스터에 연결됩니다. 특히 클러스터 스토리지에 최적화된 무료, 확장 가능, 오픈 소스 분산 파일 시스템인 GlusterFS 파일 시스템을 사용했습니다. 그러나 IBM은 더 이상이 솔루션을 지원하지 않습니다. IBM의 지원을 유지하려면 지원되는 iSCSI 호환 파일 시스템을 사용해야 합니다. Microsoft는 옵션으로 S2D(스토리지 공간 다이렉트)를 제공합니다.
이 문서는 이 Azure 마이그레이션에 사용되는 아키텍처를 설명합니다. 고객은 Red Hat Linux 7.4를 사용하여 구성을 테스트했습니다. 이 버전은 Azure Marketplace에서 사용할 수 있습니다. Linux 배포판을 선택하기 전에 현재 지원되는 버전을 확인해야 합니다. 자세한 내용은 IBM DB2 pureScale 및 GlusterFS에 대한 설명서를 참조하세요.
이 문서를 토대로 DB2 구현 계획을 시작할 수 있습니다. 사용자의 비즈니스 요구 사항은 다르지만 동일한 기본 패턴이 적용됩니다. 또한 Azure의 OLAP(온라인 분석 처리) 애플리케이션에서도 이러한 아키텍처 패턴을 사용할 수 있습니다.
이 문서에서 z/OS용 IBM DB2 데이터베이스를 Linux에서 실행되는 IBM DB2 pureScale로 이동하기 위한 가능한 마이그레이션 작업 및 기능의 차이점은 다루지 않습니다. DB2 z/OS에서 DB2 pureScale로 이동할 때의 크기 예측 및 작업 분석도 제공하지 않습니다.
작업 환경에 가장 적합한 DB2 pureScale 아키텍처를 결정하려면 크기를 완전히 예측한 후에 가설을 세우는 것이 좋습니다. 원본 시스템에서는 데이터 공유 아키텍처, 결합 기능 구성 및 DDF(분산 데이터 시설) 사용량 통계를 포함하는 DB2 z/OS Parallel Sysplex를 고려해야 합니다.
참고 항목
이 문서에서는 DB2 마이그레이션 방법 중 하나를 설명하지만 다른 방법도 있습니다. 예를 들어, DB2 pureScale를 가상화된 온-프레미스 환경에서 실행할 수도 있습니다. IBM은 다양한 구성의 Microsoft Hyper-V에서 DB2를 지원합니다. 자세한 내용은 IBM 지식 센터에서 DB2 pureScale 가상화 아키텍처를 참조하세요.
아키텍처
Azure에서 고가용성 및 확장성을 지원하기 위해 DB2 pureScale에 대해 스케일 아웃 공유 데이터 아키텍처를 사용할 수 있습니다. 고객 마이그레이션에서 다음 예제 아키텍처가 사용되었습니다.
이 다이어그램은 DB2 pureScale 클러스터에 필요한 논리 계층을 보여 줍니다. 여기에는 클라이언트한, 관리, 캐싱, 데이터베이스 엔진 및 공유 스토리지에 대한 가상 머신이 포함됩니다.
이 다이어그램에는 데이터베이스 엔진 노드 외에, 클러스터 CF(캐싱 기능)에 사용되는 두 개의 노드가 포함됩니다. 데이터베이스 엔진 자체에는 두 개 이상의 노드가 사용됩니다. pureScale 클러스터에 속하는 DB2 서버를 멤버라고 합니다.
클러스터는 스케일 아웃 스토리지와 고가용성을 제공하기 위해 iSCSI를 통해 3노드 공유 스토리지 클러스터에 연결됩니다. DB2 pureScale는 Linux를 실행하는 Azure Virtual Machines에 설치됩니다.
이 방법은 조직의 크기 및 규모를 수정할 수 있는 템플릿입니다. 기준이 되는 사항은 다음과 같습니다.
둘 이상의 데이터베이스 멤버가 둘 이상의 CF 노드와 결합됩니다. 노드는 공유 메모리에 대한 GBP(전역 버퍼 풀)과 GLM(전역 잠금 관리자) 서비스를 관리하여 활성 멤버의 공유 액세스 및 잠금 경합을 제어합니다. 하나의 CF 노드가 주 노드로 사용되고 다른 CF 노드가 보조 장애 조치(failover) CF 노드로 사용됩니다. 환경에서 단일 실패 지점을 방지하려면 DB2 pureScale 클러스터에 4개 이상의 노드가 필요합니다.
고성능 공유 스토리지(다이어그램에서 P30 크기로 표시) 각 노드는 이 스토리지를 사용합니다.
데이터 멤버 및 공유 스토리지에 대한 고성능 네트워킹
컴퓨팅 고려 사항
이 아키텍처는 Azure Virtual Machines에서 애플리케이션, 스토리지 및 데이터 계층을 실행합니다. 배포 설정 스크립트는 다음을 만듭니다.
DB2 pureScale 클러스터 Azure에서 필요한 컴퓨팅 리소스의 유형은 설정에 따라 달라집니다. 일반적으로 다음 두 가지 방법을 사용할 수 있습니다.
중소규모 인스턴스가 공유 스토리지에 액세스하는 다중 노드, HPC(고성능 컴퓨팅) 스타일 네트워크를 사용합니다. 이 HPC 유형의 구성에서 Azure 메모리 최적화 E 시리즈 또는 스토리지 최적화 L 시리즈 가상 머신은 필요한 컴퓨팅 성능을 제공합니다.
데이터 엔진에 대해 더 적은 수의 대형 가상 머신 인스턴스를 사용합니다. 대규모 인스턴스의 경우 가장 큰 메모리 최적화 M 시리즈 가상 머신이 메모리 내 워크로드가 과도한 경우에 적합합니다. DB2를 실행하는 데 사용하는 논리 파티션(LPAR)의 크기에 따라 전용 인스턴스가 필요할 수 있습니다.
DB2 CF는 E 시리즈 또는 L 시리즈와 같은 메모리 최적화 가상 머신을 사용합니다.
Linux를 실행하는 Standard_DS4_v2 가상 머신을 사용하는 공유 스토리지 클러스터입니다.
Management Jumpbox는 Linux를 실행하는 Standard_DS2_v2 가상 머신입니다. 대안은 가상 네트워크의 모든 VM에 보안 RDP/SSH 환경을 제공하는 서비스인 Azure Bastion입니다.
클라이언트는 Windows를 실행하는 Standard_DS3_v2 가상 머신(테스트용)입니다.
선택 사항. 미러링 모니터 서버입니다. 이는 DB2 pureScale의 특정 이전 버전에만 필요합니다. 이 예제에서는 Linux를 실행하는 Standard_DS3_v2 가상 머신(DB2 pureScale에 사용)을 사용합니다.
참고 항목
DB2 pureScale 클러스터에는 두 개 이상의 DB2 인스턴스가 필요합니다. 캐시 인스턴스 및 잠금 관리자 인스턴스도 필요합니다.
스토리지 고려 사항
Oracle RAC와 같이, DB2 pureScale는 고성능 블록 I/O를 스케일 아웃 데이터베이스입니다. 요구에 적합한 가장 큰 Azure 프리미엄 SSD 옵션을 사용하는 것이 좋습니다. 프로덕션 환경에서는 종종 더 많은 스토리지 용량이 필요하지만, 개발 및 테스트 환경에서는 더 작은 스토리지 옵션이 적합할 수 있습니다. 이 예제 아키텍처는 크기 및 가격 대비 IOPS 비율 때문에 P30을 사용합니다. 크기에 관계없이, 최상의 성능을 얻으려면 Premium Storage를 사용합니다.
DB2 pureScale는 모든 클러스터 노드에서 모든 데이터에 액세스할 수 있는 모두 공유 아키텍처를 사용합니다. Premium Storage는 주문형이든 또는 전용 인스턴스이든 관계없이 여러 인스턴스에서 공유되어야 합니다.
대형 DB2 pureScale 클러스터에는 IOPS가 100,000인 200TB(테라바이트) 이상의 Premium 공유 Storage가 더 많이 필요할 수 있습니다. DB2 pureScale는 Azure에서 사용할 수 있는 iSCSI 블록 인터페이스를 지원합니다. iSCSI 인터페이스에는 S2D 또는 다른 도구를 사용하여 구현할 수 있는 공유 스토리지 클러스터가 필요합니다. 이 유형의 솔루션은 Azure에서 vSAN(가상 스토리지 영역 네트워크) 디바이스를 만듭니다. DB2 pureScale는 vSAN을 사용하여 가상 머신 간에 데이터를 공유하는 데 사용되는 클러스터형 파일 시스템을 설치합니다.
네트워킹 고려 사항
IBM은 DB2 pureScale 클러스터의 모든 멤버에 대해 InfiniBand 네트워킹을 권장합니다. 또한 DB2 pureScale은 가능한 경우 CF에 대해 RDMA(원격 직접 메모리 액세스)를 사용합니다.
설치 중에 모든 가상 머신을 포함하는 Azure 리소스 그룹을 만듭니다. 일반적으로 리소스의 수명 및 관리하는 주체에 따라 리소스를 그룹화합니다. 이 아키텍처의 가상 머신에는 가속 네트워킹이 필요합니다. 이것은 SR-IOV(단일 루트 I/O 가상화)를 통해 가상 머신에 일관되게 매우 짧은 네트워크 대기 시간을 제공하는 Azure 기능입니다.
모든 Azure Virtual Machine은 서브넷, 즉 주 서브넷, Gluster FS 프런트 엔드(gfsfe), Gluster FS 백 엔드(bfsbe), DB2 pureScale(db2be) 및 DB2 purescale 프런트 엔드(db2fe)가 있는 가상 네트워크에 배포됩니다. 설치 스크립트는 주 서브넷의 가상 머신에 주 NIC도 만듭니다.
네트워크 보안 그룹을 사용하여 가상 네트워크 내의 네트워크 트래픽을 제한하고 서브넷을 격리합니다.
Azure에서 DB2 pureScale는 스토리지에 대한 네트워크 연결로 TCP/IP를 사용해야 합니다.