Laden von Daten in Azure SQL
Nachdem eine Datenbank oder Instanz bereitgestellt, überprüft und konfiguriert wurde, besteht der nächste logische Schritt darin, Daten in diese Datenbank bzw. Instanz zu importieren.
Optionen
Für das Laden von Daten in Azure SQL sind viele Optionen verfügbar. Einige überlappen sich mit dem, was lokal verfügbar ist. In dieser Lerneinheit werden einige erläutert.
Massenkopierprogramm
Das Massenkopierprogramm (Bulk Copy Program, BCP) ist ein gängiges Tool zum Herstellen einer Verbindung mit Azure SQL von einem lokalen Standort oder einer Azure-VM aus. Anschließend können Sie es zum Verschieben von Daten in Azure SQL verwenden.
Masseneinfügung
Masseneinfügungsvorgänge ähneln denen, die in SQL Server lokal verfügbar sind. Aber anstatt Daten aus einer Datei oder mehreren Dateien auf Ihrem Rechner zu laden, laden Sie Daten aus dem Azure Blob-Speicher. In der nächsten Übung sehen Sie ein Beispiel, wie das geht.
SSIS-Pakete
In Azure SQL können Sie über Pakete um eine lokale Verbindung mit SSIS (SQL Server Integration Services) herstellen. Sie können eine SSIS-Datenbank in Azure SQL-Datenbank oder Azure SQL Managed Instance hosten. Außerdem können Sie Azure-SSIS Integration Runtime für SSIS-Pakete mit Tools wie Azure Data Factory verwenden.
Weitere Optionen
Weitere interessante Optionen sind z. B. die Verwendung von Technologien wie Spark oder Azure Data Factory, um Daten in Azure SQL-Datenbank oder Azure SQL Managed Instance zu laden. Obwohl es nicht direkt mit dem Thema „Laden“ zusammenhängt, ist es möglich, eine Datenbank zu erstellen, indem Sie eine bestehende Datenbank als Kopie verwenden oder eine BACPAC-Datei importieren. In Azure SQL Managed Instance können Sie T-SQL-Befehle zum nativen Wiederherstellen einer Datenbank aus einer URL verwenden.
Überlegungen zum Laden von Daten
Der größte Unterschied zwischen dem lokalen Laden von Daten und dem Laden von Daten in Azure SQL besteht darin, dass die Daten, die Sie laden möchten, in Azure gehostet sein müssen. Die Daten können nicht lokal in Dateien gehostet werden. Alternativ können Sie die lokalen Dateien und Dateisysteme in Azure Blob Storage speichern. Diese Strategie erhöht auch Ihre Effizienz beim Laden Ihrer Dateien und beim Einrichten von ETL-Aufträgen.
Sie sollten auch bedenken, dass die minimale Protokollierung nicht unterstützt wird, sodass Sie immer den vollständigen Wiederherstellungsmodus verwenden. Aufgrund des vollständigen Wiederherstellungsmodus und der Grenzwerte für den Protokolldurchsatz kann sich die Protokollgovernance beim Laden von Daten auswirken. Techniken wie die Verwendung von Batches und deren angemessene Dimensionierung werden beim Massenladen wichtig. Weitere Tipps finden Sie in der folgenden Übung. Das Laden in einen geclusterten Columnstore-Index kann in Abhängigkeit vom Szenario dazu beitragen, Transaktionsprotokollbeschränkungen zu vermeiden.