Freigeben über


Verwenden eines Python-Skripts zum Bereitstellen eines Big-Data-Clusters für SQL Server in Azure Kubernetes Service (AKS)

Gilt für: SQL Server 2019 (15.x)

Wichtig

Das Microsoft SQL Server 2019-Big Data-Cluster-Add-On wird eingestellt. Der Support für SQL Server 2019-Big Data-Clusters endet am 28. Februar 2025. Alle vorhandenen Benutzer*innen von SQL Server 2019 mit Software Assurance werden auf der Plattform vollständig unterstützt, und die Software wird bis zu diesem Zeitpunkt weiterhin über kumulative SQL Server-Updates verwaltet. Weitere Informationen finden Sie im Ankündigungsblogbeitrag und unter Big Data-Optionen auf der Microsoft SQL Server-Plattform.

In diesem Tutorial verwenden Sie ein Python-Beispielskript, um SQL Server 2019: Big Data-Cluster in Azure Kubernetes Service (AKS) bereitzustellen.

Tipp

Sie können Big-Data-Cluster nicht nur mit AKS in Kubernetes hosten. Informationen zu anderen Bereitstellungsoptionen und zum Anpassen dieser Optionen finden Sie unter Bereitstellen von Big Data-Cluster für SQL Server in Kubernetes.

Die hier verwendete Standardbereitstellung für Big-Data-Cluster besteht aus einer SQL-Masterinstanz, einer Computepoolinstanz, zwei Datenpoolinstanzen und zwei Speicherpoolinstanzen. Daten werden dauerhaft mit persistenten Kubernetes-Volumes gespeichert, die die Standardspeicherklassen von AKS verwenden. Die Standardkonfiguration, die in diesem Tutorial verwendet wird, eignet sich für Entwicklungs- und Testumgebungen.

Voraussetzungen

  • Ein Azure-Abonnement.
  • Big-Data-Tools:
    • azdata
    • kubectl
    • Azure Data Studio
    • Erweiterung von SQL Server 2019
    • Azure-Befehlszeilenschnittstelle

Anmelden bei Ihrem Azure-Konto

Das Skript verwendet die Azure CLI, um die Erstellung eines AKS-Clusters zu automatisieren. Sie müssen sich mindestens einmal bei Ihrem Azure-Konto mit der Azure CLI anmelden, bevor Sie das Skript ausführen. Geben Sie über eine Eingabeaufforderung den folgenden Befehl ein: Weitere Informationen finden Sie unter Anmelden mit Azure CLI.

az login

Herunterladen des Bereitstellungsskripts

In diesem Tutorial wird die Erstellung des Big-Data-Clusters in AKS mit dem Python-Skript deploy-sql-big-data-aks.py automatisiert. Wenn Sie Python für azdatabereits installiert haben, sollten Sie das Skript in diesem Tutorial problemlos ausführen können.

Führen Sie in PowerShell unter Windows oder Bash unter Linux den folgenden Befehl aus, um das Bereitstellungsskript von GitHub herunterzuladen.

curl -o deploy-sql-big-data-aks.py "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/deployment/aks/deploy-sql-big-data-aks.py"

Ausführen des Bereitstellungsskripts

Führen Sie das Bereitstellungsskript anhand der folgenden Schritte in einer Bash-Eingabeaufforderung von Windows PowerShell oder Linux aus. Dieses erstellt einen AKS-Dienst in Azure und stellt anschließend einen Big-Data-Cluster für SQL Server 2019 in AKS bereit. Sie können das Skript auch mit anderen Umgebungsvariablen anpassen, um eine benutzerdefinierte Bereitstellung zu erstellen.

  1. Führen Sie das Skript mit dem folgenden Befehl aus:

    python deploy-sql-big-data-aks.py
    

    Hinweis

    Wenn sowohl python3 als auch python2 auf dem Clientcomputer installiert sind und beide Versionen in den Suchpfad für Befehle eingebunden sind, müssen Sie den Befehl mit python3 ausführen: python3 deploy-sql-big-data-aks.py.

  2. Geben Sie folgende Informationen ein, wenn Sie dazu aufgefordert werden:

    Wert BESCHREIBUNG
    Azure-Abonnement-ID Die Azure-Abonnement-ID, die für AKS verwendet werden soll. Sie können Ihre Abonnements und deren IDs auflisten, indem Sie az account list über eine andere Befehlszeile ausführen.
    Azure-Ressourcengruppe Der Name der Azure-Ressourcengruppe, die für den AKS-Cluster erstellt werden soll.
    Azure-Region Die Azure-Region für den neuen AKS-Cluster (Standardwert: westus (USA, Westen)).
    Größe des Computers Die Größe des Computers, die für Knoten im AKS-Cluster verwendet werden soll (Standardwert: Standard_D16s_v3)
    Workerknoten Die Anzahl der Workerknoten im AKS-Cluster (Standardwert: 1).
    Clustername Der Name des AKS-Clusters und des Big-Data-Clusters. Der Name Ihres Big-Data-Clusters darf nur alphanumerische Zeichen enthalten. Außerdem darf er nur aus Kleinbuchstaben bestehen und keine Leerzeichen enthalten (Standardwert: sqlbigdata).
    Kennwort Das Kennwort für den Controller, das HDFS/Spark-Gateway und die Masterinstanz (Standardwert: MySQLBigData2019).
    Benutzername Der Benutzername für den Controllerbenutzer (Standardwert: admin).

    Wichtig

    Die Standardcomputergröße Standard_D16s_v3 ist möglicherweise nicht in allen Azure-Regionen verfügbar. Wenn Sie eine andere Größe auswählen, müssen Sie sicherstellen, dass die Gesamtzahl der Datenträger, die den Knoten im Cluster angefügt werden können, größer oder gleich 24 ist. Auf dem Cluster ist für jeden PersistentVolumeClaim ein angefügter Datenträger erforderlich. Aktuell sind für Big-Data-Cluster 24 PersistentVolumeClaims erforderlich.

    Führen Sie den folgenden Befehl aus, um die verfügbaren VM-Typen zu ermitteln.

    az vm list-sizes --query "sort_by(@,&name)[?contains(name,'Standard_D16s')]" -l westus2 -o table
    

    Hinweis

    Das SQL Server-Konto sa ist während der Bereitstellung eines Big Data-Clusters deaktiviert. In der SQL Server-Masterinstanz werden neue SysAdmin-Anmeldeinformationen bereitgestellt, bei denen der Name der Eingabe für Benutzername und das Kennwort der Eingabe für Kennwort entspricht. Die gleichen Werte für Benutzername und Kennwort werden zur Bereitstellung eines Controller-Administratorbenutzers verwendet. Bei vor SQL Server 2019 CU5 bereitgestellten Clustern ist der einzige für das Gateway (Knox) unterstützte Benutzer root und das Kennwort das gleiche wie oben.

    Beginnend mit SQL Server 2019 (15.x) CU 5 verwenden alle Endpunkte einschließlich Gateway AZDATA_USERNAME und AZDATA_PASSWORD, wenn Sie einen neuen Cluster mit Standardauthentifizierung bereitstellen. Endpunkte auf Clustern, die ein Upgrade auf CU 5 erhalten, verwenden weiterhin root als Nutzername für die Verbindung mit dem Gatewayendpunkt. Diese Änderung gilt nicht für Bereitstellungen, die die Active Directory-Authentifizierung verwenden. Weitere Informationen finden Sie unter Anmeldeinformationen für den Zugriff auf Dienste über den Gatewayendpunkt in den Versionshinweisen.

  3. Das Skript erstellt zunächst einen AKS-Cluster mithilfe der Parameter, die Sie angegeben haben. Dieser Schritt dauert einige Minuten.

Überwachen des Status

Nachdem das Skript den AKS-Cluster erstellt hat, werden die erforderlichen Umgebungsvariablen mit den Einstellungen festgelegt, die Sie zuvor angegeben haben. Anschließend wird azdata aufgerufen, um den Big-Data-Cluster in AKS bereitzustellen.

Der Bereitstellungsstatus wird im Befehlsfenster des Clients ausgegeben. Im Verlauf des Bereitstellungsprozesses sollten mehrere Wartemeldungen für den Controllerpod angezeigt werden:

2018-11-15 15:42:02.0209 UTC | INFO | Waiting for controller pod to be up...

Nach 10 bis 20 Minuten sollten Sie benachrichtigt werden, dass der Controllerpod ausgeführt wird:

2018-11-15 15:50:50.0300 UTC | INFO | Controller pod is running.
2018-11-15 15:50:50.0585 UTC | INFO | Controller Endpoint: https://111.111.111.111:30080

Wichtig

Die vollständige Bereitstellung kann einige Zeit in Anspruch nehmen, da die Containerimages für die Komponenten des Big-Data-Clusters heruntergeladen werden müssen. Der Vorgang sollte jedoch nicht mehrere Stunden dauern. Wenn Probleme bei der Bereitstellung auftreten, finden Sie weitere Informationen unter Überwachung und Problembehandlung: Big Data-Cluster für SQL Server.

Überprüfen des Clusters

Sie können während der Bereitstellung jederzeit mit kubectl oder azdata den Status des ausgeführten Big-Data-Clusters überprüfen und sich Details anzeigen lassen.

Verwenden von kubectl

Öffnen Sie ein neues Befehlsfenster, um kubectl während des Bereitstellungsprozesses zu verwenden.

  1. Führen Sie den folgenden Befehl aus, um eine Zusammenfassung des Status für den gesamten Cluster abzurufen:

    kubectl get all -n <your-big-data-cluster-name>
    

    Tipp

    Wenn Sie den Namen des Big-Data-Clusters nicht geändert haben, verwendet das Skript den Standardnamen sqlbigdata.

  2. Überprüfen Sie die Kubernetes-Dienste und ihre internen und externen Endpunkte mit dem folgendenkubectl-Befehl:

    kubectl get svc -n <your-big-data-cluster-name>
    
  3. Sie können den Status der Kubernetes-Pods auch mit dem folgenden Befehl überprüfen:

    kubectl get pods -n <your-big-data-cluster-name>
    
  4. Weitere Informationen zu einem bestimmten Pod können Sie mit dem folgenden Befehl abrufen:

    kubectl describe pod <pod name> -n <your-big-data-cluster-name>
    

Tipp

Weitere Informationen zum Überwachen und Behandeln von Problemen einer Bereitstellung finden Sie unter Überwachung und Problembehandlung: Big Data-Cluster für SQL Server.

Herstellen einer Verbindung mit dem Cluster

Nachdem das Bereitstellungsskript erfolgreich ausgeführt wurde, wird die folgende Meldung ausgegeben:

2018-11-15 16:10:25.0583 UTC | INFO | Cluster state: Ready
2018-11-15 16:10:25.0583 UTC | INFO | Cluster deployed successfully.

Der Big-Data-Cluster für SQL Server wurde in AKS bereitgestellt. Nun können Sie Azure Data Studio verwenden, um eine Verbindung mit dem Cluster herzustellen. Weitere Informationen finden Sie unter Herstellen einer Verbindung mit einem Big-Data-Cluster für SQL Server mithilfe von Azure Data Studio.

Bereinigung

Wenn Sie Big Data-Cluster für SQL Server in Azure testen, sollten Sie abschließend den AKS-Cluster löschen, um unerwartete Gebühren zu vermeiden. Entfernen Sie den Cluster nicht, wenn Sie ihn weiterhin verwenden möchten.

Warnung

Wenn Sie die folgenden Schritte ausführen, werden der AKS-Cluster und die Big-Data-Cluster für SQL Server gelöscht. Wenn Sie über Datenbanken oder HDFS-Daten verfügen, die Sie beibehalten möchten, müssen Sie diese Daten sichern, bevor Sie den Cluster löschen.

Führen Sie den folgenden Azure CLI-Befehl aus, um den Big-Data-Cluster und den AKS-Dienst in Azure zu entfernen. Ersetzen Sie dabei <resource group name> durch die Azure-Ressourcengruppe, die Sie im Bereitstellungsskript angegeben haben:

az group delete -n <resource group name>