Résoudre les problèmes liés aux clusters Big Data à l’aide de Jupyter Notebooks et d’Azure Data Studio

Article
01/23/2025

Cette page est un index des notebooks pour les clusters Big Data SQL Server. Ces notebooks exécutables (.ipynb) sont conçus pour SQL Server 2019 pour aider à résoudre les problèmes des clusters Big Data.

Important

Le module complémentaire Microsoft SQL Server 2019 Big Data Clusters sera mis hors service. La prise en charge des clusters Big Data SQL Server 2019 prendra fin le 28 février 2025. Tous les utilisateurs existants de SQL Server 2019 avec Software Assurance seront entièrement pris en charge sur la plateforme et le logiciel continuera d’être géré via les mises à jour cumulatives SQL Server jusqu’à ce moment-là. Pour plus d’informations, consultez le billet de blog d’annonce et les Options Big Data sur la plateforme Microsoft SQL Server.

Chaque notebook est conçu pour vérifier ses propres dépendances. L’option Exécuter toutes les cellules s’effectue correctement ou produit une exception avec un conseil en lien hypertexte vers un autre notebook qui va résoudre la dépendance manquante. Suivez le lien hypertexte de l’indicateur vers le notebook cible, puis cliquez sur Exécuter toutes les cellules. En cas de réussite, revenez au bloc-notes d’origine, puis cliquez sur Exécuter toutes les cellules.

Une fois toutes les dépendances installées, si toutefois l'étape Exécuter toutes les cellules échoue, chaque bloc-notes analysera les résultats et, le cas échéant, produira un lien hypertexte vers un autre bloc-notes pour faciliter la résolution du problème.

Pour plus d'informations sur l'utilisation des notebooks pour administrer les clusters Big Data SQL Server, consultez Gérer les clusters Big Data SQL Server avec les notebooks d'Azure Data Studio.
Pour plus d’informations sur l’emplacement des notebooks d’administration de cluster Big Data, consultez Emplacement des notebooks d’administration de clusters Big Data SQL Server.

Résolution des problèmes liés aux clusters Big Data

Cette section contient un ensemble de notebooks permettant d’obtenir des journaux à partir d’un cluster Big Data SQL Server.

Nom	Description
TSG100 - Utilitaire de résolution des problèmes des clusters Big Data	Vue d’ensemble de tous les notebooks disponibles sur la résolution des problèmes liés aux clusters Big Data et le moment de leur utilisation
TSG101 - Utilitaire de résolution des problèmes SQL Server	Vue d’ensemble de tous les notebooks disponibles pour résoudre les problèmes liés à SQL Server et quand les utiliser
TSG102 - Utilitaire de résolution des problèmes HDFS	Vue d’ensemble de tous les notebooks disponibles pour résoudre les problèmes HDFS et quand les utiliser
TSG103 - Utilitaire de résolution des problèmes Spark	Vue d’ensemble de tous les notebooks disponibles pour résoudre les problèmes Spark et quand les utiliser
TSG104 - Utilitaire de résolution des problèmes de contrôle	Vue d’ensemble de tous les notebooks disponibles pour résoudre les problèmes de contrôleur et quand les utiliser
TSG105 - Utilitaire de résolution des problèmes de passerelle	Vue d’ensemble de tous les blocs-notes disponibles pour résoudre les problèmes de la passerelle Knox et quand les utiliser
TSG106 - Utilitaire de résolution des problèmes d’application	Vue d’ensemble de tous les blocs-notes disponibles pour résoudre les problèmes de App-Deploy et quand les utiliser

Diagnostiquer les problèmes à partir de clusters Big Data

Un ensemble de notebooks permettant de diagnostiquer des situations et des états liés à un cluster Big Data.

Nom	Description
TSG002 - CrashLoopBackoff	Ce TSG se connecte à chaque conteneur dont la dernière tentative d’atteindre l’état « en cours d’exécution » a échoué et qui obtient les journaux de conteneur actuels et précédents. Cela est utile pour déboguer les problèmes CrashLoopBackOff signalés dans les pods get kubectl.
TSG025 - Navigateur FSM - État FSM du contrôleur de requêtes	Utilisez ce notebook pour vous connecter à la base de données du contrôleur et parcourir l’état FSM (Fine State Machine). Utilisez ce bloc-notes pour répertorier les ordinateurs d’état actifs et identifier les flux de travail bloqués.
TSG026 - Se connecter au nœud du pool de données (pour exécuter T-SQL)	Utilisez ce notebook pour vous connecter au nœud du pool de données (pour exécuter T-SQL)
TSG027 - Observer le déploiement de grappe	Utilisez ce notebook pour observer le déploiement de cluster, il fournit des conseils pour résoudre les problèmes liés aux clusters Big Data SQL Server qui créent des problèmes, les commandes suivantes sont souvent utiles pour identifier les causes sous-jacentes.
TSG029 - Rechercher des dumps dans le cluster	Utilisez ce notebook pour observer des coredumps et des minidumps à partir de processus tels que SQL Server ou un contrôleur dans un cluster Big Data.
TSG032 - Utilisation du processeur et de la mémoire pour tous les conteneurs	Utilisez ce notebook pour vérifier l’utilisation du processeur et de la mémoire pour tous les conteneurs.
TSG037 - Déterminer le réplica principal hébergeant le pod du pool principal	Utilisez ce notebook pour déterminer le réplica principal hébergeant le pod du pool principal pour le cluster Big Data lorsque la haute disponibilité du pool principal est activée.
TSG044 - Exécuter sqlcmd dans un conteneur de pool maître	Utilisez ce notebook pour vous connecter à un nœud de pool maître directement via T-SQL.
TSG055 - Roulement de temps pour Sparkhead	Utilisez ce notebook pour diagnostiquer les étapes permettant de comprendre le temps de réponse du Roulement du pod contrôleur au pod sparkhead.
TSG060 - Espace disque du volume persistant pour tous les PVC du cluster Big Data	Utilisez ce notebook pour vous connecter à chaque conteneur et obtenir l’espace disque utilisé/disponible pour chaque volume persistant (PV) mappé à chaque revendication de volume persistant (PVC) d’un cluster Big Data.
TSG078 - Le cluster est-il sain ?	Utilisez ce notebook pour vérifier si votre cluster Big Data est sain.
TSG079 - Générer une copie de sauvegarde de base du contrôleur	Utilisez ce notebook pour générer une copie de sauvegarde de base du contrôleur.
TSG086 - Exécuter le niveau supérieur de tous les conteneurs	Utilisez ce notebook pour exécuter le niveau supérieur de tous les conteneurs.
TSG087 - Utiliser l’interface CLI hadoop fs sur le pod namenode	Utilisez ce notebook pour utiliser l’interface CLI hadoop fs sur le pod namenode.
TSG108 - Afficher la carte de configuration de mise à niveau du contrôleur	Utilisez ce notebook pour résoudre la défaillance survenue lors de l’exécution d’une mise à niveau du cluster Big Data à l’aide de la mise à niveau azdata BDC.
TSG112 - Vérifications de prédéploiement Active Directory	Utilisez ce notebook pour valider qu'une configuration de cluster Big Data est appropriée pour un déploiement Active Directory.
TSG115 - Traducteur de journal de sécurité SQL Server sur Linux	Utilisez ce notebook pour analyser les journaux générés par les enregistreurs d’événements security.ldap et security.kerberos pour SQL Server sur Linux. Pour activer ces enregistreurs d’événements, placez les lignes ci-dessous dans /var/opt/mssql/logger.ini sur la machine exécutant SQL Server sur Linux. Remarque : ce fichier respecte la casse.
TSG116 - Translator de journaux de support de sécurité BDC SQL	Utilisez ce notebook pour analyser les journaux générés par le service de support de sécurité dans le BDC SQL. Pour récupérer les journaux, nous allons copier les journaux de débogage à partir du cluster et les extraire. Suivez les étapes ci-dessous : exécutez « azdata bdc debug copy-logs -n <espace_de_noms> ». Ceci va créer plusieurs fichiers .tar.gz - Extrayez le contenu de debuglogs-<espace_de_noms>-<date>-<time>.tar.gz - Recherchez le journal de support de sécurité stocké à l’emplacement ./<espace_de_noms>/control-<…>/security-support/supervisol/log/secsupp-stderr---<…>.log.
TSG119 - Vérifications de post-déploiement Active Directory	Ce notebook est conçu pour valider votre configuration BDC après un déploiement AD. Il vérifie l’existence d’entrées DNS pour tous les points de terminaison avec un attribut dnsName et ces entrées DNS doivent être des enregistrements hôtes, et non des alias (c’est-à-dire des enregistrements non CNAME). En outre, l’existence de comptes AD connus et leur activation et l’existence des SPN attendus