Compartilhar via


IBM DB2 pureScale no Azure

O ambiente IBM DB2 pureScale fornece um cluster de banco de dados para o Azure com alta disponibilidade e escalabilidade nos sistemas operacionais Linux. Este artigo mostra uma arquitetura para executar o DB2 pureScale no Azure.

Visão geral

As empresas há muito tempo usavam plataformas tradicionais de sistemas de gerenciamento de banco de dados relacional (RDBMS) para atender às suas necessidades de processamento de transações on-line (OLTP). Atualmente, muitos estão migrando seus ambientes de banco de dados baseados em mainframe para o Azure como uma forma de expandir a capacidade, reduzir custos e manter uma estrutura de custo operacional estável. A migração é frequentemente o primeiro passo na modernização de uma plataforma legada.

Recentemente, um cliente empresarial re-hospedou seu ambiente IBM DB2 em execução no z/OS para o IBM DB2 pureScale no Azure. A solução de cluster de banco de dados Db2 pureScale fornece alta disponibilidade e escalabilidade nos sistemas operacionais Linux. O cliente executou o Db2 com êxito como uma instância autônoma de expansão em uma única VM (máquina virtual) em um sistema de grande escala no Azure antes da instalação do DB2 pureScale.

Apesar de não ser idêntico ao ambiente original, o IBM DB2 pureScale no Linux oferece recursos semelhantes de alta disponibilidade e escalabilidade como o IBM DB2 para z/OS em execução em uma configuração de Parallel Sysplex no mainframe. Nesse cenário, o cluster é conectado via iSCSI a um cluster de armazenamento compartilhado. Usamos o sistema de arquivos GlusterFS, um sistema de arquivos distribuído gratuito, escalável e de código aberto, otimizado especificamente para armazenamento em nuvem. No entanto, a IBM não dá mais suporte a essa solução. Para manter o suporte da IBM, você precisa usar um sistema de arquivos compatível com iSCSI com suporte. A Microsoft oferece Espaços de Armazenamento Diretos (S2D) como uma opção

Este artigo descreve a arquitetura usada para essa migração do Azure. O cliente usou o Red Hat Linux 7.4 para testar a configuração. Esta versão está disponível no Azure Marketplace. Antes de escolher uma distribuição do Linux, não se esqueça de verificar as versões com suporte no momento. Para obter detalhes, confira a documentação do IBM DB2 pureScale e GlusterFS.

Este artigo é um ponto de partida para seu plano de implementação do DB2. Seus requisitos de negócios serão diferentes, mas o mesmo padrão básico se aplica. Você também pode usar esse padrão arquitetural para aplicativos OLAP (processamento analítico online) no Azure.

Este artigo não cobre diferenças e possíveis tarefas de migração para mover um banco de dados IBM DB2 para z/OS para o IBM DB2 pureScale em execução no Linux. Tampouco fornece estimativas de dimensionamento e análises de carga de trabalho para passar do DB2 z/OS para o DB2 pureScale.

Para ajudá-lo a decidir sobre a melhor arquitetura DB2 pureScale para seu ambiente, é recomendável que você faça uma estimativa completa do dimensionamento e crie uma hipótese. No sistema de origem, considere DB2 z/OS Parallel Sysplex com arquitetura de compartilhamento de dados, configuração do Coupling Facility e estatísticas de uso do DDF (facilitador de dados distribuídos).

Observação

Este artigo descreve uma abordagem à migração DB2, mas há outras. Por exemplo, o DB2 pureScale também pode ser executado em ambientes locais virtualizados. A IBM dá suporte para o DB2 no Microsoft Hyper-V em várias configurações. Para obter mais informações, confira Arquitetura de virtualização DB2 pureScale no IBM Knowledge Center.

Arquitetura

Para oferecer suporte à alta disponibilidade e escalabilidade no Azure, é possível usar uma arquitetura de dados compartilhada em expansão pode ser usada para o DB2 pureScale. A migração do cliente usou o exemplo de arquitetura a seguir.

DB2 pureScale em máquinas virtuais do Azure mostrando o armazenamento e a rede

O diagrama mostra as camadas lógicas necessárias para um cluster DB2 pureScale. Isso inclui máquinas virtuais para um cliente, para gerenciamento, para armazenamento em cache, para o mecanismo de banco de dados e para armazenamento compartilhado.

Além dos nós do Mecanismo de Banco de Dados, o diagrama inclui dois nós usados para CFs (recursos de armazenamento em cache) do cluster. Pelo menos dois nós são usados para o mecanismo de banco de dados. Um servidor DB2 que pertence a um cluster pureScale é chamado de membro.

O cluster é conectado via iSCSI a um cluster de armazenamento compartilhado de três nós para fornecer expansão de armazenamento e alta disponibilidade. O DB2 pureScale é instalado em máquinas virtuais do Azure que executam o Linux.

Essa abordagem é um modelo que você pode modificar para o tamanho e escala da sua organização. É baseada no seguinte:

  • dois ou mais membros do banco de dados são combinados com pelo menos dois nós do CF. Os nós gerenciam um GBP (pool de buffers global) para serviços de memória compartilhada e GLM (gerenciador de bloqueio global) para controlar o acesso compartilhado e bloquear a contenção de membros ativos. Um nó CF atua como primário e o outro como o nó CF secundário de failover. Para evitar um ponto único de falha no ambiente, um cluster de pureScale DB2 requer pelo menos quatro nós.

  • Armazenamento compartilhado de alto desempenho (mostrado em tamanho P30 no diagrama). Cada nó usa esse armazenamento.

  • Rede de alto desempenho para os membros de dados e armazenamento compartilhado.

Considerações de computação

Essa arquitetura executa os níveis de aplicativo, armazenamento e dados nas máquinas virtuais do Azure. Os scripts de configuração de implantação criam o seguinte:

  • Um cluster DB2 pureScale. O tipo de recursos de computação necessários no Azure depende da sua configuração. Em geral, é possível usar duas abordagens:

    • Use uma rede no estilo de computação de alto desempenho e vários nós (HPC), em que instâncias de pequeno a médio porte acessam o armazenamento compartilhado. Para esse tipo de HPC de configuração, máquinas virtuais do Azure E-series otimizadas para memória ou L-series otimizadas para armazenamento fornecem a potência de computação necessária.

    • Use menos instâncias grandes de máquinas virtuais para os mecanismos de dados. Para instâncias grandes, as maiores máquinas virtuais M-series com otimização de memória são ideais para cargas de trabalho com muita memória. Você pode precisar de uma instância dedicada, dependendo do tamanho da LPAR (partição lógica) que é usada para executar o DB2.

  • O DB2 CF usa máquinas virtuais otimizadas para memória, como E-series ou L-series.

  • Um cluster de armazenamento compartilhado que usa máquinas virtuais Standard_DS4_v2 que executam o Linux.

  • O Jumpbox de gerenciamento é uma máquina virtual Standard_DS2_v2 executando Linux. Uma alternativa é o Azure Bastion, um serviço que fornece uma experiência segura de RDP/SSH para todas as VMs da rede virtual.

  • O cliente é uma máquina virtual Standard_DS3_v2 executando o Windows (usada para teste).

  • Opcional. Um servidor testemunha. Isso só é necessário com determinadas versões anteriores do Db2 pureScale. Este exemplo usa uma máquina virtual Standard_DS3_v2 executando Linux (usada para o DB2 pureScale).

Observação

Um cluster DB2 pureScale requer pelo menos duas instâncias de DB2. Também requer uma instância de cache e uma instância do gerenciador de bloqueio.

Considerações de armazenamento

Como o Oracle RAC, o DB2 pureScale é um banco de dados de expansão de E/S de bloco de alto desempenho. Recomendamos o uso da maior opção de SSD Premium do Azure que atenda às suas necessidades. Opções de armazenamento menores podem ser adequadas para ambientes de desenvolvimento e teste, enquanto ambientes de produção geralmente precisam de maior capacidade de armazenamento. A arquitetura de exemplo usa P30 devido à sua proporção de IOPS para tamanho e preço. Independentemente do tamanho, use o Armazenamento Premium para obter o melhor desempenho.

O DB2 pureScale usa uma arquitetura de tudo compartilhado, na qual todos os dados são acessíveis de todos os nós do cluster. O armazenamento Premium deve ser compartilhado entre várias instâncias, seja sob demanda ou em instâncias dedicadas.

Um grande cluster DB2 pureScale pode exigir 200 TB (terabytes) ou mais de armazenamento compartilhado Premium, com IOPS de 100.000. O DB2 pureScale dá suporte a uma interface de bloco iSCSI que pode ser usada no Azure. A interface iSCSI requer um cluster de armazenamento compartilhado que você pode implementar com o S2D ou outra ferramenta. Esse tipo de solução cria um dispositivo de rede de área de armazenamento virtual (vSAN) no Azure. O DB2 pureScale usa o vSAN para instalar o sistema de arquivos em cluster que é usado para compartilhar dados entre máquinas virtuais.

Considerações de rede

A IBM recomenda a rede InfiniBand para todos os membros em um cluster DB2 pureScale. O DB2 pureScale também usa RDMA (acesso remoto direto à memória), quando disponível, para os CFs.

Durante a instalação, você cria um grupo de recursos do Azure para conter todas as máquinas virtuais. Em geral, os recursos são agrupados com base no tempo de vida e em quem vai gerenciá-los. As máquinas virtuais nessa arquitetura exigem rede acelerada. É um recurso do Azure que fornece latência de rede consistente e ultrabaixa por meio de SR-IOV (virtualização de E/S de raiz única) para uma máquina virtual.

Cada máquina virtual do Azure é implantada em uma rede virtual que tem sub-redes: main, front-end Gluster FS (gfsfe), back-end Gluster FS (bfsbe), DB2 pureScale (db2be) e front-end dB2 purescale (db2fe). O script de instalação também cria as NICs primárias nas máquinas virtuais na sub-rede principal.

Use grupos de segurança de rede para restringir o tráfego de rede dentro da rede virtual e para isolar as sub-redes.

No Azure, o DB2 pureScale precisa usar TCP/IP como a conexão de rede para armazenamento.

Próximas etapas