Freigeben über


Erfassen von Daten aus Azure-Speicher

Die Datenaufnahme ist der Prozess, der zum Laden von Daten aus einer oder mehreren Quellen in eine Tabelle im Azure-Daten-Explorer verwendet wird. Nach der Erfassung stehen die Daten für die Abfrage zur Verfügung. In diesem Artikel erfahren Sie, wie Sie Daten aus Azure-Speicher (ADLS Gen2-Container, Blobcontainer oder einzelnen Blobs) in eine neue oder vorhandene Tabelle abrufen.

Die Aufnahme kann als einmaliger Vorgang oder als fortlaufende Methode erfolgen. Die kontinuierliche Aufnahme kann nur über das Portal konfiguriert werden.

Allgemeine Informationen zur Datenaufnahme finden Sie in der Übersicht über die Erfassung von Daten im Azure-Daten-Explorer.

Voraussetzungen

Datensammlung

  1. Wählen Sie im linken Menü " Abfrage" aus.

  2. Klicken Sie mit der rechten Maustaste auf die Datenbank, in der Sie die Daten aufnehmen möchten. Wählen Sie Daten abrufen.

    Screenshot der Registerkarte

Quelle

Im Fenster Daten abrufen ist die Registerkarte Quelle ausgewählt.

Wählen Sie die Datenquelle aus der verfügbaren Liste aus. In diesem Beispiel erfassen Sie Daten aus Azure-Speicherauf.

Screenshot des Fensters „Daten abrufen“ mit ausgewählter Quellregisterkarte.

Konfigurieren

  1. Wählen Sie eine Zieldatenbank und -tabelle aus. Wenn Sie Daten in einer neuen Tabelle erfassen möchten, wählen Sie +Neue Tabelle aus, und geben Sie einen Tabellennamen ein.

    Hinweis

    Tabellennamen können bis zu 1024 Zeichen umfassen und alphanumerische Zeichen, Bindestriche und Unterstriche enthalten. Sonderzeichen werden nicht unterstützt.

  2. Um Ihre Quelle hinzuzufügen, wählen Sie "Container auswählen" oder "URI hinzufügen" aus.

    1. Wenn Sie "Container auswählen" ausgewählt haben, füllen Sie die folgenden Felder aus:

      Screenshot des Tabs „Konfigurieren“ mit ausgewählter neuer Tabelle und ausgewählter Beispieldatendatei.

      Einstellung Feldbeschreibung
      Abonnement Die Abonnement-ID, in der sich das Speicherkonto befindet.
      Speicherkonto Der Name, der Ihr Speicherkonto identifiziert.
      Container Der Speichercontainer, den Sie aufnehmen möchten.
      Dateifilter (optional)
      Ordnerpfad Filtert Daten zum Erfassen von Dateien mit einem bestimmten Ordnerpfad.
      Dateierweiterung Filtert Daten, um Dateien nur mit einer bestimmten Dateierweiterung zu erfassen.
    2. Wenn Sie "URI hinzufügen" ausgewählt haben, fügen Sie ihren Speicher Verbindungszeichenfolge für einen BLOB-Container oder einzelne Dateien im URI-Feld ein, und wählen Sie +dann aus.

      Hinweis

      • Sie können bis zu 10 einzelne Blobs hinzufügen. Jedes Blob kann maximal 1 GB (dekomprimiert) sein.
      • Sie können bis zu 5.000 Blobs aus einem einzelnen Container erfassen.

      Screenshot der Registerkarte

  3. Klicken Sie auf Weiter.

Inspizieren

Die Registerkarte Prüfen wird mit einer Vorschau der Daten geöffnet.

Um den Erfassungsvorgang abzuschließen, wählen Sie Fertig stellen aus.

Screenshot der Registerkarte „Einfügen“

Optional:

  • Wählen Sie die Befehlsanzeige, um die aus Ihren Eingaben generierten automatischen Befehle anzuzeigen und zu kopieren.
  • Verwenden Sie die Dateidropdownliste Schemadefinition, um die Datei zu ändern, von der das Schema abgeleitet wird.
  • Ändern Sie das automatisch abgeleitete Datenformat, indem Sie das gewünschte Format aus der Dropdownliste auswählen. Informationen zum Aufnehmen finden Sie unter Datenformate, die vom Azure-Daten-Explorer unterstützt werden.
  • Spalten bearbeiten.
  • Erkunden Sie Erweiterte Optionen basierend auf dem Datentyp.

Bearbeiten von Spalten

Hinweis

  • Bei Tabellenformaten (CSV, TSV, PSV) können Sie eine Spalte nicht zweimal zuordnen. Löschen Sie bei einer Zuordnung zu einer vorhandenen Spalte zunächst die neue Spalte.
  • Der Typ einer vorhandenen Spalte kann nicht geändert werden. Wenn Sie als Zuordnungsziel eine Spalte mit einem anderen Format verwenden, erhalten Sie ggf. leere Spalten.

Die Änderungen, die Sie an einer Tabelle vornehmen können, hängen von den folgenden Parametern ab:

  • Die Tabelle ist neu oder vorhanden.
  • Die Zuordnung ist neu oder vorhanden.
Tabellentyp Zuordnungstyp Verfügbare Anpassungen
Neue Tabelle Neue Zuordnung Spalte umbenennen, Datentyp ändern, Datenquelle ändern, Zuordnungstransformation, Spalte hinzufügen, Spalte löschen
Vorhandene Tabelle Neue Zuordnung Spalte hinzufügen (für die Sie dann den Datentyp ändern und die Sie umbenennen und aktualisieren können)
Vorhandene Tabelle Vorhandene Zuordnung keine

Screenshot der zur Bearbeitung geöffneten Spalten.

Zuordnungstransformationen

Einige der Datenformatzuordnungen (Parquet, JSON und Avro) unterstützen einfache Transformationen während der Erfassung. Erstellen oder aktualisieren Sie zum Anwenden von Zuordnungstransformationen eine Spalte im Fenster Spalten bearbeiten.

Zuordnungstransformationen können für eine Spalte ausgeführt werden, für die als Typ der Wert „string“ oder „datetime“ und für Quelle der Datentyp „int“ oder „long“ angegeben ist. Die folgenden Zuordnungstransformationen werden unterstützt:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Erweiterte Optionen basierend auf dem Datentyp

Tabellarisch (CSV, TSV, PSV):

  • Wenn Sie tabellarische Formate in einer vorhandenen Tabelle aufnehmen, können Sie "Erweitertes>Aktuelles Tabellenschema beibehalten" auswählen. Tabellendaten enthalten nicht unbedingt die Spaltennamen, die verwendet werden, um Quelldaten den vorhandenen Spalten zuzuordnen. Wenn diese Option aktiviert ist, wird die Zuordnung nach der geltenden Reihenfolge durchgeführt, und das Tabellenschema bleibt unverändert. Wenn diese Option deaktiviert ist, werden unabhängig von der Datenstruktur neue Spalten für eingehende Daten erstellt.

  • Wählen Sie Erweitert>Erste Zeile ist Spaltenüberschrift, um die erste Zeile als Spaltennamen zu verwenden.

    Screenshot der erweiterten Optionen

JSON:

  • Wählen Sie Erweitert>Verschachtelte Ebenen, von 1 bis 100, um die Spaltenaufteilung der JSON-Daten festzulegen.

  • Wenn Sie "Erweitertes>Ignorieren von Datenformatfehlern" auswählen, werden die Daten im JSON-Format aufgenommen. Wenn Sie das Kontrollkästchen nicht aktivieren, werden die Daten im MultiJSON-Format erfasst.

    Screenshot der erweiterten Optionen

Zusammenfassung

Im Fenster Datenaufbereitung werden alle drei Schritte mit grünen Häkchen markiert, wenn die Datenerfassung erfolgreich abgeschlossen wurde. Sie können die Befehle anzeigen, die für jeden Schritt verwendet wurden, oder eine Karte zum Abfragen, Visualisieren oder Ablegen der aufgenommenen Daten auswählen.

Screenshot: Zusammenfassungsseite mit abgeschlossener Datenerfassung