Abrufen von Daten aus Amazon S3
In diesem Artikel erfahren Sie, wie Sie Daten aus Amazon S3 in eine neue oder vorhandene Tabelle abrufen. Amazon S3 ist ein Objektspeicherdienst, der zum Speichern und Abrufen von Daten entwickelt wurde.
Weitere Informationen zu Amazon S3 finden Sie unter Was ist Amazon S3?.
Voraussetzungen
- Ein Arbeitsbereich mit einer Microsoft Fabric-fähigen Kapazität
- Eine KQL-Datenbank mit Bearbeitungsberechtigungen
- Ein Amazon S3-Bucket mit Daten
Source
Wählen Sie im unteren Menüband Ihrer KQL-Datenbank Daten abrufen aus.
Im Fenster Daten abrufen ist die Registerkarte Quelle ausgewählt.
Wählen Sie die Datenquelle aus der verfügbaren Liste aus. In diesem Beispiel erfassen Sie Daten von Amazon S3.
Konfigurieren
Wählen Sie eine Zieltabelle aus. Wenn Sie Daten in eine neue Tabelle erfassen möchten, wählen Sie +Neue Tabelle aus, und geben Sie einen Tabellennamen ein.
Hinweis
Tabellennamen können bis zu 1024 Zeichen umfassen und alphanumerische Zeichen, Bindestriche und Unterstriche enthalten. Sonderzeichen werden nicht unterstützt.
Fügen Sie in das Feld URI die Verbindungszeichenfolge eines einzelnen Buckets oder ein einzelnes Objekt im folgenden Format ein.
Bucket:
https://
BucketName.s3.
RegionName.amazonaws.com;AwsCredentials=
AwsAccessID,
AwsSecretKeyOptional können Sie Bucket-Filter anwenden, um Daten nach einer bestimmten Dateierweiterung zu filtern.
Wählen Sie Weiter aus.
Inspizieren
Die Registerkarte Prüfen wird mit einer Vorschau der Daten geöffnet.
Um den Erfassungsvorgang abzuschließen, wählen Sie Fertig stellen aus.
Optional:
- Wählen Sie die Befehlsanzeige, um die aus Ihren Eingaben generierten automatischen Befehle anzuzeigen und zu kopieren.
- Verwenden Sie die Dateidropdownliste Schemadefinition, um die Datei zu ändern, von der das Schema abgeleitet wird.
- Ändern Sie das automatisch abgeleitete Datenformat, indem Sie das gewünschte Format aus der Dropdownliste auswählen. Weitere Informationen finden Sie unter Von Real-Time Analytics unterstützte Datenformate.
- Spalten bearbeiten.
- Erkunden Sie Erweiterte Optionen basierend auf dem Datentyp.
Bearbeiten von Spalten
Hinweis
- Bei Tabellenformaten (CSV, TSV, PSV) können Sie eine Spalte nicht zweimal zuordnen. Löschen Sie bei einer Zuordnung zu einer vorhandenen Spalte zunächst die neue Spalte.
- Der Typ einer vorhandenen Spalte kann nicht geändert werden. Wenn Sie als Zuordnungsziel eine Spalte mit einem anderen Format verwenden, erhalten Sie ggf. leere Spalten.
Die Änderungen, die Sie an einer Tabelle vornehmen können, hängen von den folgenden Parametern ab:
- Die Tabelle ist neu oder vorhanden.
- Die Zuordnung ist neu oder vorhanden.
Tabellentyp | Zuordnungstyp | Verfügbare Anpassungen |
---|---|---|
Neue Tabelle | Neue Zuordnung | Spalte umbenennen, Datentyp ändern, Datenquelle ändern, Zuordnungstransformation, Spalte hinzufügen, Spalte löschen |
Vorhandene Tabelle | Neue Zuordnung | Spalte hinzufügen (für die Sie dann den Datentyp ändern und die Sie umbenennen und aktualisieren können) |
Vorhandene Tabelle | Vorhandene Zuordnung | Keine |
Zuordnungstransformationen
Einige der Datenformatzuordnungen (Parquet, JSON und Avro) unterstützen einfache Transformationen während der Erfassung. Erstellen oder aktualisieren Sie zum Anwenden von Zuordnungstransformationen eine Spalte im Fenster Spalten bearbeiten.
Zuordnungstransformationen können für eine Spalte ausgeführt werden, für die als Typ der Wert „string“ oder „datetime“ und für Quelle der Datentyp „int“ oder „long“ angegeben ist. Die folgenden Zuordnungstransformationen werden unterstützt:
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconds
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
Erweiterte Optionen basierend auf dem Datentyp
Tabellarisch (CSV, TSV, PSV):
Wenn Sie Tabellenformate in eine bestehende Tabelle übernehmen, wählen Sie Erweitert>Tabellenschema beibehalten aus. Tabellendaten enthalten nicht unbedingt die Spaltennamen, die verwendet werden, um Quelldaten den vorhandenen Spalten zuzuordnen. Wenn diese Option aktiviert ist, wird die Zuordnung nach der geltenden Reihenfolge durchgeführt, und das Tabellenschema bleibt unverändert. Wenn diese Option deaktiviert ist, werden unabhängig von der Datenstruktur neue Spalten für eingehende Daten erstellt.
Wählen Sie Erweitert>Erste Zeile ist Spaltenüberschrift, um die erste Zeile als Spaltennamen zu verwenden.
JSON:
Wählen Sie Erweitert>Verschachtelte Ebenen, von 1 bis 100, um die Spaltenaufteilung der JSON-Daten festzulegen.
Wenn Sie Erweitert>JSON-Zeilen mit Fehlern überspringen wählen, werden die Daten im JSON-Format eingelesen. Wenn Sie das Kontrollkästchen nicht aktivieren, werden die Daten im MultiJSON-Format erfasst.
Zusammenfassung
Im Fenster Datenaufbereitung werden alle drei Schritte mit grünen Häkchen markiert, wenn die Datenerfassung erfolgreich abgeschlossen wurde. Sie können eine Karte auswählen, die abgefragt werden soll, die aufgenommenen Daten ablegen oder ein Dashboard Ihrer Erfassungszusammenfassung anzeigen.
Zugehöriger Inhalt
- Informationen zum Verwalten Ihrer Datenbank finden Sie unter Verwalten von Daten.
- Informationen zum Erstellen, Speichern und Exportieren von Abfragen finden Sie unter Abfragen von Daten in einem KQL-Abfrageset.