Azure Synapse Analytics-Task
Gilt für: SQL Server SSIS Integration Runtime in Azure Data Factory
Der Azure Synapse Analytics-Task ermöglicht es einem SSIS-Paket, Tabellendaten aus dem Dateisystem oder Azure Blob Storage in einen dedizierten Azure Synapse Analytics-SQL-Pool zu kopieren. Der Task nutzt PolyBase zur Leistungssteigerung gemäß der Beschreibung im Artikel Azure Synapse Analytics Loading Patterns and Strategies(Azure Synapse Analytics: Muster und Strategien zum Laden). Das gegenwärtig unterstützte Quelldatenformat ist Text mit Trennzeichen in UTF8-Codierung. Beim Kopieren aus einem Dateisystem werden Daten zunächst in Azure Blob Storage für das Staging und dann in einen dedizierten SQL-Pool hochgeladen. Darum ist ein Azure Blob Storage-Konto erforderlich.
Hinweis
Der Azure Storage-Verbindungs-Manager mit dem Diensttyp „Data Lake Gen2“ wird nicht unterstützt.
Wenn Sie Azure Data Lake Gen2 für das Staging oder eine Quelle verwenden möchten, können Sie über den Azure Storage-Verbindungs-Manager eine Verbindung mit dem Diensttyp „Azure Blob Storage“ herstellen.
Der Azure Synapse Analytics-Task ist eine Komponente des SQL Server Integration Services-Feature Packs (SSIS) für Azure.
Zum Hinzufügen eines Azure Synapse Analytics-Tasks ziehen Sie diesen aus der SSIS-Toolbox auf den Designercanvas, und doppelklicken Sie, oder klicken Sie mit der rechten Maustaste darauf, und wählen Sie dann Bearbeiten aus, um das Task-Editor-Dialogfeld zu öffnen.
Konfigurieren Sie auf der Seite Allgemein die folgenden Eigenschaften.
SourceType gibt den Typ des Quelldatenspeichers an. Wählen Sie einen der folgenden Typen aus:
- FileSystem: Die Quelldaten befinden sich im lokalen Dateisystem.
- BlobStorage: Die Quelldaten befinden sich in Azure Blob Storage.
Im Folgenden sind die Eigenschaften für jeden Quelltyp aufgeführt.
FileSystem
Feld | BESCHREIBUNG |
---|---|
LocalDirectory | Gibt das lokale Verzeichnis mit den Datendateien an, die hochgeladen werden sollen. |
Rekursiv | Gibt an, ob Unterverzeichnisse rekursiv durchsucht werden sollen. |
FileName | Geben Sie einen Namensfilter zum Auswählen von Dateien mit einem bestimmten Namensmuster an. Beispiel: „MeinArbeitsblatt*.xsl*“ schließt Dateien wie „MeinArbeitsblatt001.xsl“ und „MeinArbeitsblattABC.xslx“ ein. |
RowDelimiter | Gibt ein oder mehrere Zeichen an, die das Ende jeder Zeile markieren. |
ColumnDelimiter | Gibt ein oder mehrere Zeichen an, die das Ende jeder Spalte markieren. Beispiel: | (senkrechter Strich), \t (Tabulator), ' (einfaches Anführungszeichen), " (doppeltes Anführungszeichen) und 0x5c (umgekehrter Schrägstrich). |
IsFirstRowHeader | Gibt an, ob die erste Zeile in jeder Datendatei Spaltennamen statt tatsächlicher Daten enthält. |
AzureStorageConnection | Gibt einen Azure Storage-Verbindungs-Manager an. |
BlobContainer | Hiermit wird der Name des Blobcontainers festgelegt, auf den lokale Daten hochgeladen und über PolyBase an einen dedizierten Azure Synapse Analytics-SQL-Pool weitergeleitet werden. Falls noch nicht vorhanden ist, wird ein neuer Container erstellt. |
BlobDirectory | Hiermit wird das Blobverzeichnis (virtuelle Hierarchiestruktur) festgelegt, in das lokale Daten hochgeladen und über PolyBase an einen dedizierten Azure Synapse Analytics-SQL-Pool weitergeleitet werden. |
RetainFiles | Gibt an, ob die zu Azure Storage hochgeladenen Dateien beibehalten werden sollen. |
CompressionType | Gibt an, welches Komprimierungsformat beim Hochladen von Dateien in Azure Storage verwendet werden soll. Die lokale Quelle ist nicht betroffen. |
CompressionLevel | Gibt an, welcher Komprimierungsgrad für das Komprimierungsformat verwendet werden soll. |
SqlPoolConnection | Hiermit wird ein ADO.NET-Verbindungs-Manager für den dedizierten Azure Synapse Analytics-SQL-Pool festgelegt. |
TableName | Gibt den Namen der Zieltabelle an. Verwenden Sie entweder einen vorhandenen Tabellennamen, oder wählen Sie <Neue Tabelle...> aus, um eine neue Tabelle zu erstellen. |
TableDistribution | Gibt die Verteilungsmethode für die neue Tabelle an. Gilt, wenn für TableNameein neuer Tabellenname angegeben wird. |
HashColumnName | Gibt an, welche Spalte für die Verteilung der Hashtabelle verwendet werden soll. Gilt, wenn HASH für TableDistributionangegeben wird. |
BlobStorage
Feld | BESCHREIBUNG |
---|---|
AzureStorageConnection | Gibt einen Azure Storage-Verbindungs-Manager an. |
BlobContainer | Gibt den Namen des Blobcontainers an, in dem sich die Quelldaten befinden. |
BlobDirectory | Gibt das Blobverzeichnis (virtuelle Hierarchiestruktur) an, in dem sich die Quelldaten befinden. |
RowDelimiter | Gibt ein oder mehrere Zeichen an, die das Ende jeder Zeile markieren. |
ColumnDelimiter | Gibt ein oder mehrere Zeichen an, die das Ende jeder Spalte markieren. Beispiel: | (senkrechter Strich), \t (Tabulator), ' (einfaches Anführungszeichen), " (doppeltes Anführungszeichen) und 0x5c (umgekehrter Schrägstrich). |
CompressionType | Gibt das für die Quelldaten verwendete Komprimierungsformat an. |
SqlPoolConnection | Hiermit wird ein ADO.NET-Verbindungs-Manager für den dedizierten Azure Synapse Analytics-SQL-Pool festgelegt. |
TableName | Gibt den Namen der Zieltabelle an. Verwenden Sie entweder einen vorhandenen Tabellennamen, oder wählen Sie <Neue Tabelle...> aus, um eine neue Tabelle zu erstellen. |
TableDistribution | Gibt die Verteilungsmethode für die neue Tabelle an. Gilt, wenn für TableNameein neuer Tabellenname angegeben wird. |
HashColumnName | Gibt an, welche Spalte für die Verteilung der Hashtabelle verwendet werden soll. Gilt, wenn HASH für TableDistributionangegeben wird. |
Je nachdem, ob Sie zu einer neuen oder einer vorhandenen Tabelle kopieren, sehen Sie eine andere Seite Zuordnungen. Konfigurieren Sie im ersten Fall, welche Quellspalten zugeordnet werden sollen, sowie ihre entsprechenden Namen in der zu erstellenden Zieltabelle. Konfigurieren Sie im letzten Fall die Zuordnungsbeziehungen zwischen Quell- und Zielspalten.
Konfigurieren Sie auf der Seite Spalten die Datentypeigenschaften für jede Quellspalte.
Die Seite T-SQL zeigt die T-SQL-Anweisung, die zum Laden von Daten aus Azure Blob Storage in den dedizierten SQL-Pool verwendet wird. Das T-SQL wird automatisch von Konfigurationen auf den anderen Seiten generiert und als Teil der Taskausführung ausgeführt. Um das generierte T-SQL wahlweise nach Ihren speziellen Bedürfnissen manuell zu bearbeiten, klicken Sie auf die Schaltfläche Bearbeiten . Sie können später durch Klicken auf die Schaltfläche Zurücksetzen das automatisch generierte wiederherstellen.