Ressources déployées avec Clusters Big Data SQL Server

Article
03/21/2023

S’applique à : SQL Server 2019 (15.x)

Important

Le module complémentaire Clusters Big Data Microsoft SQL Server 2019 sera mis hors service. La prise en charge de la plateforme Clusters Big Data Microsoft SQL Server 2019 se terminera le 28 février 2025. Tous les utilisateurs existants de SQL Server 2019 avec Software Assurance seront entièrement pris en charge sur la plateforme, et le logiciel continuera à être maintenu par les mises à jour cumulatives SQL Server jusqu’à ce moment-là. Pour plus d’informations, consultez le billet de blog d’annonce et les Options Big Data sur la plateforme Microsoft SQL Server.

Cet article décrit les ressources déployées par un cluster Big Data SQL Server.

Un cluster Big Data déploie des pods en fonction du profil de déploiement. Pour plus d’informations, consultez Configurations par défaut.

Cet article décrit les pods déployés avec un profil aks-dev-test-ha et comprend un pool Spark. Interrogez Kubernetes pour voir les pods déployés dans votre cluster. L’exemple suivant retourne une liste de pods sous un espace de noms spécifique.

kubectl get pods -n <namespace>

Remplacez <namespace> par le nom de votre cluster Big Data.

Pour plus d’informations, consultez Guide pratique pour déployer Clusters Big Data SQL Server sur Kubernetes.

Le diagramme suivant montre les composants déployés dans un cluster Big Data :

big-data-cluster-diagram

Pour plus d’informations sur l’architecture, consultez Présentation des Clusters Big Data SQL Server.

Pods déployés

Le tableau suivant liste les pods déployés dans un cluster Big Data.

Nom	Domaine
`control-<nnnn>`	Contrôle
`controldb-<#>`	Contrôle
`controlwd-<nnnn>`	Contrôle
`logsdb-<#>`	Contrôle
`logsui-<nnnn>`	Contrôle
`metricsdb-<#>`	Contrôle
`metricsdc-<nnnn>`	Contrôle
`metricsui-<nnnn>`	Contrôle
`mgmtproxy-<nnnn>`	Contrôle
`zookeeper-<#>`	Contrôle
`dns-<nnnn>`	Contrôle
`master-<#n>`	Instance maître
`operator-<nnnn>`	Instance maître
`compute-<#n>-<#m>`	Pool de calcul
`data-<#>-<#>`	Pool de données
`storage-<#>-<#>`	Pool de stockage
`nmnode-<#>-<#>`	Pool de stockage
`sparkhead-<#>`	Pool de stockage
`appproxy-<#m>`	Pool d’applications
`gateway-<#>`	Service de passerelle

Tous les pods ne sont pas inclus dans chaque cluster Big Data. Les déploiements avec une haute disponibilité ou une intégration à Active Directory incluent des pods spécifiques.

Pods propres à la haute disponibilité :

operator-<nnnn>
zookeeper-<#>

Pod propres à Active Directory :

dns-<nnnn>

Les sections suivantes décrivent les pods et listent les conteneurs dans chaque pod.

Control

Les pods de contrôle fournissent le service de contrôle.

Nom du pod	Count	Type de contrôleur Kubernetes	Containers
`control-#`	1	ReplicaSet	- `controller` - `security-support` - `fluentbit`
`controldb`	1	StatefulSet	- `mssql-server` - `fluentbit`
`controlwd`	1	ReplicaSet	- `controlwatchdog`
`logsdb-#`	1	StatefulSet	- `elasticsearch`
`logsui`	1	ReplicaSet	- `kibana`
`metricsdb-#`	1	StatefulSet	- `influxdb`
`metricsdc`	1 par nœud Kubernetes.	DaemonSet	- `telegraf`
`metricsui-nnnn`	1	ReplicaSet	- `grafana`
`mgmtproxy-nnnn`	1	ReplicaSet	- `service-proxy` - `fluentbit`
`dns-nnnn`	0 ou 1 pour l’intégration à Active Directory	ReplicaSet	- `dns` - `fluentbit`

Instance principale

master-<#n> est l’instance maître SQL Server.

Gère le pool de données via DDL
Manipule les données dans le pool de données via DML
Déplace l’exécution des requêtes analytiques vers le pool de données

Nom du pod	Count	Type de contrôleur Kubernetes	Containers
`master-<#n>`	1 ou plus pour la haute disponibilité.	StatefulSet	- `mssql-server` - `fluentbit` - `collectd` - `mssql-ha-supervisor` ^*
`operator`^*	0 ou 1 pour la haute disponibilité	ReplicaSet	- `mssql-ha-operator`

^* Uniquement les déploiements à haute disponibilité. L’opérateur implémente et inscrit la définition de ressource personnalisée pour SQL Server et les ressources de groupe de disponibilité. Quand l’opérateur est déployé, il s’inscrit lui-même en tant qu’écouteur pour les notifications relatives aux ressources SQL Server déployées dans le cluster Kubernetes. mssql-ha-supervisor prend en charge le groupe de disponibilité.

Chaque pod master contient une instance de SQL Server. Un déploiement à haute disponibilité comprend trois pods. Chaque pod comprend une instance de SQL Server avec des bases de données dans un groupe de disponibilité Always On SQL Server.

Ajoutez des pods supplémentaires au moment du déploiement, en fonction de votre charge de travail.

Pool de calcul

Le pool de calcul fournit une instance de SQL Server pour le calcul.

Nom du pod	Count	Type de contrôleur Kubernetes	Containers
`compute-<#n>-<#m>`	1 ou plus.	StatefulSet	- `mssql-server` - `fluentbit` - `collectd`

#n identifie le pool de calcul.
#m identifie l’ID d’instance dans le pool.

Les instances du pool de calcul SQL Server sont sans état. Elles nécessitent uniquement le stockage pour tempdb.

Ajoutez des pods supplémentaires au moment du déploiement, en fonction de votre charge de travail.

Pool de données

Le pool de données fournit des instances de SQL Server pour le stockage et le calcul.

Nom du pod	Count	Type de contrôleur Kubernetes	Containers
`data-<#n>-<#m>`	0 ou plus	StatefulSet	- `mssql-server` - `fluentbit` - `collectd`

#n identifie le pool de données.
#m identifie l’ID d’instance dans le pool.

Ajoutez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail.

Pool de stockage

Le pool de stockage fournit l’ingestion des données par le biais de Spark, le stockage dans HDFS, l’accès aux données par le biais de HDFS et des points de terminaison SQL Server.

Nom du pod	Count	Type de contrôleur Kubernetes	Containers
`storage-0-#`	1 ou plus. Ajoutez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail.	StatefulSet	- `hadoop` - `mssql-server` - `fluentbit`
`nmnode-0-#`	1 ou plus pour la haute disponibilité	StatefulSet	- `hadoop` - `fluentbit`
`sparkehead-#`	1 ou plus pour la haute disponibilité	StatefulSet	- `hadoop-yarn-jobhistory` - `hadoop-livy-sparkhistory` - `hadoop-hivemetastore` -- `fluentbit`
`zookeeper`	0 ou 3 pour la haute disponibilité.	StatefulSet	- `zookeeper` - `fluentbit`

Pool d'applications

Le pool d’applications est inclus dans certains profils de configuration de test. Le pool d’applications héberge des proxys de service d’application que vous définissez quand vous déployez vos applications pour des clusters Big Data.

appproxy est une API web qui se trouve devant les applications du pool d’applications. Elle authentifie les utilisateurs, puis route les requêtes vers les applications.

Nom du pod	Type de contrôleur Kubernetes	Containers
`appproxy`	ReplicaSet	- `app-service-proxy` - `fluentbit`

Pour plus d’informations, consultez Présentation du déploiement d’application sur un cluster Big Data.

Ajoutez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail.

Service de passerelle

Les services de passerelle fournissent la passerelle Knox à Spark, HDFS, Yarn, l’interface utilisateur Yarn et l’interface utilisateur Spark.

Nom du pod	Type de contrôleur Kubernetes	Containers
`gateway-<#>`	StatefulSet	- `knox` - `fluentbit`

Une seule passerelle est prise en charge.

Références de conteneur open source

Pour plus d’informations sur des versions et projets open source spécifiques, consultez Informations de référence sur les logiciels Open Source.

Étapes suivantes

Pour en savoir plus sur les Clusters Big Data SQL Server, consultez les ressources suivantes :

Partage via