Partilhar via


Introdução aos pools de computação em Clusters de Big Data do SQL Server

Aplica-se a: SQL Server 2019 (15.x)

Importante

O complemento Clusters de Big Data do Microsoft SQL Server 2019 será desativado. O suporte para Clusters de Big Data do SQL Server 2019 será encerrado em 28 de fevereiro de 2025. Todos os usuários existentes do SQL Server 2019 com Software Assurance terão suporte total na plataforma e o software continuará a ser mantido por meio de atualizações cumulativas do SQL Server até esse momento. Para obter mais informações, confira a postagem no blog de anúncio e as opções de Big Data na plataforma do Microsoft SQL Server.

Este artigo descreve a função dos pools de computação do SQL Server em um cluster de Big Data do SQL Server. Os pools de computação fornecem recursos computacionais de expansão para um cluster de Big Data do SQL Server. Eles são usados para descarregar o trabalho computacional ou os conjuntos de resultados intermediários da instância mestra do SQL Server. As seções a seguir descrevem a arquitetura, a funcionalidade e os cenários de uso de um pool de computação.

Você também pode assistir a este vídeo de cinco minutos para obter uma introdução aos pools de computação:

Arquitetura do pool de computação

Um pool de computação é composto por um ou mais pods de computação em execução no Kubernetes. A criação e o gerenciamento automatizados desses pods são coordenados pela Instância mestre do SQL Server. Cada pod contém um conjunto de serviços básicos e uma instância do mecanismo de banco de dados do SQL Server.

Arquitetura do pool de computação

Grupos de expansão

Um pool de computação pode funcionar como um grupo de expansão do PolyBase para consultas distribuídas em diferentes fontes de dados externas, como o SQL Server, o Oracle, o MongoDB, o Teradata e o HDFS. Usando pods do computação no Kubernetes, os clusters de Big Data do SQL Server podem automatizar a criação e a configuração de pods de computação para os grupos de escala horizontal do PolyBase.

Cenários de pool de computação

Entre os cenários em que o pool de computação é usado estão:

  • Cenários em que as consultas enviadas à instância mestra usam uma ou mais tabelas localizadas no pool de armazenamento.

  • Cenários em que as consultas enviadas à instância mestra usam uma ou mais tabelas com a distribuição round robin localizada no pool de dados.

  • Cenários em que as consultas enviadas à instância mestra usam tabelas particionadas com fontes de dados externas do SQL Server, do Oracle, do MongoDB e do Teradata. Para esse cenário, a dica de consulta OPTION (FORCE SCALEOUTEXECUTION) precisa estar habilitada.

  • Cenários em que as consultas enviadas à instância mestra usam uma ou mais tabelas localizadas na camada do HDFS.

Entre os cenários em que o pool de computação não é usado estão:

  • Cenários em que as consultas enviadas à instância mestra usam uma ou mais tabelas em um cluster HDFS externo do Hadoop.

  • Cenários em que as consultas enviadas à instância mestra usam uma ou mais tabelas no Armazenamento de Blobs do Azure.

  • Cenários em que as consultas enviadas à instância mestra usam tabelas não particionadas com fontes de dados externas do SQL Server, do Oracle, do MongoDB e do Teradata.

  • Cenários em que a dica de consulta OPTION (DISABLE SCALEOUTEXECUTION) está habilitada.

  • Cenários em que as consultas enviadas à instância mestra se aplicam a bancos de dados localizados na instância mestra.

Próximas etapas

Para saber mais sobre o Clusters de Big Data do SQL Server, confira os seguintes recursos: