Freigeben über


Schnellstart: Erfassen von Daten mithilfe von Azure Synapse-Pipelines (Vorschau)

In dieser Schnellstartanleitung erfahren Sie, wie Sie Daten aus einer Datenquelle in einen Azure Synapse Data Explorer-Pool laden.

Voraussetzungen

  • Ein Azure-Abonnement. Erstellen Sie ein kostenloses Azure-Konto.

  • Erstellen eines Data Explorer-Pools über Synapse Studio oder im Azure-Portal

  • Erstellen Sie eine Data Explorer-Datenbank.

    1. Wählen Sie in Synapse Studio im linken Bereich Daten aus.

    2. Wählen Sie + (Neue Ressource hinzufügen) >Data Explorer-Pool aus, und verwenden Sie die folgenden Informationen:

      Einstellung Vorgeschlagener Wert BESCHREIBUNG
      Poolname contosodataexplorer Name des zu verwendende Data Explorer-Pools
      Name TestDatabase Der Datenbankname muss innerhalb des Clusters eindeutig sein.
      Standardaufbewahrungszeitraum 365 Die Zeitspanne (in Tagen), für die garantiert wird, dass die Daten für Abfragen verfügbar bleiben. Die Zeitspanne wird ab dem Zeitpunkt gemessen, zu dem die Daten erfasst werden.
      Standardcachezeitraum 31 Die Zeitspanne (in Tagen), wie lange häufig abgefragte Daten im SSD-Speicher oder RAM (und nicht im längerfristigen Speicher) verfügbar bleiben.
    3. Wählen Sie Erstellen, um die Datenbank zu erstellen. Die Erstellung dauert in der Regel weniger als eine Minute.

  • Erstellen einer Tabelle

    1. Wählen Sie in Synapse Studio im linken Bereich Entwickeln aus.
    2. Wählen Sie unter KQL-Skripts die Option + (Neue Ressource hinzufügen) >KQL-Skript aus. Im rechten Bereich können Sie Ihr Skript benennen.
    3. Wählen Sie im Menü Verbinden mit den Eintrag contosodataexplorer aus.
    4. Wählen Sie im Menü Datenbank verwenden die Option TestDatabase aus.
    5. Fügen Sie den folgenden Befehl ein, und wählen Sie Ausführen aus, um die Tabelle zu erstellen.
    .create table StormEvents (StartTime: datetime, EndTime: datetime, EpisodeId: int, EventId: int, State: string, EventType: string, InjuriesDirect: int, InjuriesIndirect: int, DeathsDirect: int, DeathsIndirect: int, DamageProperty: int, DamageCrops: int, Source: string, BeginLocation: string, EndLocation: string, BeginLat: real, BeginLon: real, EndLat: real, EndLon: real, EpisodeNarrative: string, EventNarrative: string, StormSummary: dynamic)
    

    Tipp

    Vergewissern Sie sich, dass die Tabelle erstellt wurde. Wählen Sie im linken Bereich Daten, dann das Menü mit weiteren Optionen für contosodataexplorer und anschließend Aktualisieren aus. Erweitern Sie unter contosodataexplorer den Knoten Tabellen, und stellen Sie sicher, dass die Tabelle StormEvents in der Liste angezeigt wird.

  • Abrufen der Abfrage- und Datenerfassungsendpunkte Sie benötigen den Abfrageendpunkt zum Konfigurieren Ihres verknüpften Diensts.

    1. Wählen Sie in Synapse Studio im linken Bereich die Option Verwalten>Data Explorer-Pools aus.

    2. Wählen Sie den Data Explorer-Pool aus, zu dem Sie Details anzeigen möchten.

      Screenshot of the Data Explorer pools screen, showing the list of existing pools.

    3. Notieren Sie sich die Abfrage- und Datenerfassungsendpunkte. Verwenden Sie den Abfrageendpunkt als Cluster, wenn Sie Verbindungen mit Ihrem Data Explorer-Pool konfigurieren. Verwenden Sie beim Konfigurieren von SDKs für die Datenerfassung den Datenerfassungsendpunkt.

      Screenshot of the Data Explorer pools properties pane, showing the Query and Data Ingestion URI addresses.

Erstellen eines verknüpften Diensts

In Azure Synapse Analytics definieren Sie in einem verknüpften Dienst Ihre Verbindungsinformationen für andere Dienste. In diesem Abschnitt erstellen Sie einen verknüpften Dienst für Azure Data Explorer.

  1. Wählen Sie in Synapse Studio im linken Bereich Verwalten>Verknüpfte Dienste aus.

  2. Wählen Sie + Neu aus.

    Screenshot of the Linked services screen, showing the list of existing services and highlighting the add new button.

  3. Wählen Sie im Katalog den Dienst Azure Data Explorer und dann Weiter aus.

    Screenshot of the new Linked services pane, showing the list of available services and highlighting the add new Azure Data Explorer service.

  4. Verwenden Sie auf der Seite „Neue verknüpfte Dienste“ die folgenden Informationen:

    Einstellung Vorgeschlagener Wert Beschreibung
    Name contosodataexplorerlinkedservice Der Name für den neuen verknüpften Azure Data Explorer-Dienst
    Authentifizierungsmethode Verwaltete Identität Die Authentifizierungsmethode für den neuen Dienst
    Kontoauswahlmethode Manuell eingeben Die Methode zum Angeben des Abfrageendpunkts
    Endpunkt https://contosodataexplorer.contosoanalytics.dev.kusto.windows.net Der Abfrageendpunkt, den Sie sich zuvor notiert haben
    Datenbank TestDatabase Die Datenbank, in der Sie Daten erfassen möchten

    Screenshot of the new Linked services details pane, showing the fields that need to be completed for the new service.

  5. Wählen Sie Verbindung testen aus, um die Einstellungen zu überprüfen, und wählen Sie dann Erstellen aus.

Erstellen einer Pipeline zum Erfassen von Daten

Eine Pipeline enthält den logischen Ablauf für die Ausführung einer Aktivitätenmenge. In diesem Abschnitt erstellen Sie eine Pipeline mit einer Copy-Aktivität, die Daten aus Ihrer bevorzugten Quelle in einem Data Explorer-Pool erfasst.

  1. Wählen Sie in Synapse Studio im linken Bereich Integrieren aus.

  2. Wählen Sie +>Pipeline aus. Im rechten Bereich können Sie Ihre Pipeline benennen.

    Screenshot showing the selection for creating a new pipeline.

  3. Ziehen Sie unter Aktivitäten>Verschieben und transformieren den Befehl Daten kopieren auf die Pipelinecanvas.

  4. Wählen Sie die Copy-Aktivität aus, und wechseln Sie zur Registerkarte Quelle. Wählen Sie ein neues Quelldataset als Quelle aus, aus der Daten kopiert werden sollen, oder erstellen Sie ein neues Quelldataset.

  5. Wechseln Sie zur Registerkarte Senke. Klicken Sie auf Neu, um ein neues Senkendataset zu erstellen.

    Screenshot of the pipeline copy activity, showing the selection for creating a new sink.

  6. Wählen Sie im Katalog das Dataset Azure Data Explorer und dann Weiter aus.

  7. Verwenden Sie im Bereich Eigenschaften festlegen die folgenden Informationen, und wählen Sie dann OK aus.

    Einstellung Vorgeschlagener Wert Beschreibung
    Name AzureDataExplorerTable Der Name für die neue Pipeline
    Verknüpfter Dienst contosodataexplorerlinkedservice Der verknüpfte Dienst, den Sie zuvor erstellt haben
    Tabelle StormEvents Die zuvor erstellte Tabelle

    Screenshot of the pipeline copy activity set properties pane, showing the fields that need to be completed for the new sink.

  8. Wählen Sie zum Überprüfen der Pipeline auf der Symbolleiste die Option Überprüfen aus. Das Ergebnis der Pipelineüberprüfungsausgabe wird rechts auf der Seite angezeigt.

Debuggen und Veröffentlichen der Pipeline

Nach Abschluss der Konfiguration Ihrer Pipeline können Sie einen Debuglauf durchführen, bevor Sie Ihre Artefakte zur Überprüfung veröffentlichen, ob alles einwandfrei ist.

  1. Wählen Sie auf der Symbolleiste Debuggen aus. Der Status der Pipelineausführung wird unten im Fenster auf der Registerkarte Ausgabe angezeigt.

  2. Wenn die Pipelineausführung erfolgreich war, wählen Sie Alle veröffentlichen aus. Mit dieser Aktion werden erstellte Entitäten (Datasets und Pipelines) im Synapse Analytics-Dienst veröffentlicht.

  3. Warten Sie, bis die Meldung Erfolgreich veröffentlicht angezeigt wird. Wenn Sie Benachrichtigungsmeldungen anzeigen möchten, wählen Sie oben rechts die Schaltfläche mit der Glocke aus.

Auslösen und Überwachen der Pipeline

In diesem Abschnitt lösen Sie die im vorherigen Schritt veröffentlichte Pipeline manuell aus.

  1. Wählen Sie in der Symbolleiste die Option Trigger hinzufügen und dann Jetzt auslösen. Klicken Sie auf der Seite Pipelineausführung auf OK.

  2. Wechseln Sie in der linken Randleiste zur Registerkarte Monitor. Sie sehen eine Pipelineausführung, die von einem manuellen Trigger ausgelöst wird.

  3. Wenn die Pipelineausführung erfolgreich abgeschlossen wurde, wählen Sie den Link unter der Spalte Pipelinename aus, um Details zur Aktivitätsausführung anzuzeigen oder die Pipeline erneut auszuführen. Da in diesem Beispiel nur eine Aktivität vorhanden ist, wird in der Liste nur ein Eintrag angezeigt.

  4. Wenn Sie Details zum Kopiervorgang anzeigen möchten, wählen Sie unter der Spalte Activity name (Aktivitätsname) den Link Details (das Brillensymbol) aus. Sie können Details wie die Menge der Daten, die aus der Quelle in die Senke kopiert wurden, den Datendurchsatz, die Ausführungsschritte mit entsprechender Dauer sowie die verwendeten Konfigurationen überwachen.

  5. Wählen Sie oben den Link Alle Pipelineausführungen aus, um zurück zur Ansicht mit den Pipelineausführungen zu wechseln. Klicken Sie zum Aktualisieren der Liste auf Aktualisieren.

  6. Vergewissern Sie sich, dass Ihre Daten korrekt in den dedizierten Data Explorer-Pool geschrieben werden.

Nächste Schritte