Abrufen von Daten von Amazon S3

Artikel
01/31/2025

In diesem Artikel erfahren Sie, wie Sie Daten von Amazon S3 in eine neue oder vorhandene Tabelle abrufen. Amazon S3 ist ein Objektspeicherdienst, der zum Speichern und Abrufen von Daten erstellt wurde.

Weitere Informationen zu Amazon S3 finden Sie unter Was ist Amazon S3?.

Voraussetzungen

Ein Arbeitsbereich mit einer von Microsoft Fabric unterstützten Kapazität
Eine KQL-Datenbank mit Bearbeitungsberechtigungen
Ein Amazon S3-Bucket mit Daten

Quelle

Wählen Sie im unteren Menüband der KQL-Datenbank die Option Daten abrufen aus.

Im Fenster Daten abrufen ist die Registerkarte Quelle ausgewählt.
Wählen Sie die Datenquelle aus der verfügbaren Liste aus. In diesem Beispiel werden Daten aus Amazon S3eingelesen.

Konfigurieren

Wählen Sie eine Zieltabelle aus. Wenn Sie Daten in eine neue Tabelle aufnehmen möchten, wählen Sie +Neue Tabelle aus, und geben Sie einen Tabellennamen ein.

Anmerkung

Tabellennamen können bis zu 1024 Zeichen umfassen, einschließlich alphanumerischer Zeichen, Leerzeichen, Bindestriche und Unterstriche. Sonderzeichen werden nicht unterstützt.
Fügen Sie im -URI--Feld die Verbindungszeichenfolge eines einzelnen Buckets oder eines einzelnen Objekts im folgenden Format ein.

Bucket: https://BucketName.s3.RegionName.amazonaws.com;AwsCredentials=AwsAccessID,AwsSecretKey

Optional können Sie Bucketfilter anwenden, um Daten nach einer bestimmten Dateierweiterung zu filtern.
Wählen Sie Weiter aus.

Inspizieren

Die Registerkarte Untersuchen wird mit einer Vorschau der Daten geöffnet.

Um den Erfassungsprozess abzuschließen, wählen Sie Fertig stellen aus.

Optional:

Wählen Sie Befehlsanzeige aus, um die von Ihren Eingaben generierten automatischen Befehle anzuzeigen und zu kopieren.
Verwenden Sie die Schemadefinitionsdatei Dropdowndatei, um die Datei zu ändern, von der das Schema abgeleitet wird.
Ändern Sie das automatisch abgeleitete Datenformat, indem Sie das gewünschte Format aus der Dropdownliste auswählen. Weitere Informationen finden Sie unter Datenformate, die von Real-Time Intelligenceunterstützt werden.
Spaltenbearbeiten.
Erkunden Sie Erweiterte Optionen basierend auf dem Datentyp.

Spalten bearbeiten

Anmerkung

Bei tabellarischen Formaten (CSV, TSV, PSV) können Sie eine Spalte nicht zweimal abbilden. Um eine Zuordnung mit einer vorhandenen Spalte vorzunehmen, löschen Sie zunächst die neue Spalte.
Sie können keinen vorhandenen Spaltentyp ändern. Wenn Sie versuchen, einer Spalte ein unterschiedliches Format zuzuordnen, könnten Sie mit leeren Spalten enden.

Die Änderungen, die Sie in einer Tabelle vornehmen können, hängen von den folgenden Parametern ab:

Tabellentyp ist neu oder vorhanden
Die Zuordnung ist neu oder vorhanden.

Tabellentyp	Zuordnungstyp	Verfügbare Anpassungen
Neue Tabelle	Neue Zuordnung	Spalte umbenennen, Datentyp ändern, Datenquelle ändern, Zuordnungstransformation, Spalte hinzufügen, Spalte löschen
Vorhandene Tabelle	Neue Zuordnung	Spalte hinzufügen, auf der Sie den Datentyp ändern, umbenennen und aktualisieren können
Vorhandene Tabelle	Vorhandene Zuordnung	nichts

Zuordnungstransformationen

Einige Datenformatzuordnungen (Parquet, JSON und Avro) unterstützen einfache Transformationen während der Erfassung. Erstellen oder aktualisieren Sie zum Anwenden von Zuordnungstransformationen eine Spalte im Fenster Spalten bearbeiten.

Zuordnungstransformationen können für eine Spalte vom Typ "Zeichenfolge" oder "datetime" ausgeführt werden, wobei die Quelle den Datentyp "int" oder "long" aufweist. Die folgenden Zuordnungstransformationen werden unterstützt:

DateTimeFromUnixSeconds
DateTimeFromUnixMilliseconds
DateTimeFromUnixMicroseconds
DateTimeFromUnixNanoseconds

Erweiterte Optionen basierend auf dem Datentyp

Tabellarisch (CSV, TSV, PSV):

Wenn Sie Tabellenformate in eine bestehende Tabelle übernehmen, wählen Sie Erweitert>Tabellenschema beibehalten aus. Tabellarische Daten enthalten nicht unbedingt die Spaltennamen, die zum Zuordnen von Quelldaten zu den vorhandenen Spalten verwendet werden. Wenn diese Option aktiviert ist, erfolgt die Zuordnung nach Reihenfolge, und das Tabellenschema bleibt gleich. Wenn diese Option deaktiviert ist, werden neue Spalten für eingehende Daten erstellt, unabhängig von der Datenstruktur.
Wählen Sie Erweitert>Erste Zeile ist Spaltenüberschrift aus, um die erste Zeile als Spaltennamen zu verwenden.

JSON:

Wählen Sie Erweitert>Geschachtelte Ebenen, von 1 bis 100, um die Spaltenaufteilung der JSON-Daten festzulegen.
Wenn Sie Erweitert>wählen und JSON-Zeilen mit Fehlernüberspringen, werden die Daten im JSON-Format verarbeitet. Wenn Sie dieses Kontrollkästchen nicht ausgewählt lassen, werden die Daten im Multijson-Format aufgenommen.

Zusammenfassung

Im Datenvorbereitungsfenster sind alle drei Schritte mit grünen Häkchen gekennzeichnet, wenn der Datenimport erfolgreich abgeschlossen ist. Sie können eine Karte zum Abfragen auswählen, die aufgenommenen Daten löschen oder ein Dashboard Ihrer Datenaufnahmeübersicht anzeigen.

Informationen zum Verwalten ihrer Datenbank finden Sie unter Verwalten von Daten
Informationen zum Erstellen, Speichern und Exportieren von Abfragen finden Sie unter Abfragen von Daten in einem KQL-Abfrageset.

Freigeben über

Abrufen von Daten von Amazon S3

Voraussetzungen

Quelle

Konfigurieren

Inspizieren

Spalten bearbeiten

Zuordnungstransformationen

Erweiterte Optionen basierend auf dem Datentyp

Zusammenfassung

Feedback

Zusätzliche Ressourcen

Freigeben über

Abrufen von Daten von Amazon S3

Voraussetzungen

Quelle

Konfigurieren

Inspizieren

Spalten bearbeiten

Zuordnungstransformationen

Erweiterte Optionen basierend auf dem Datentyp

Zusammenfassung

Verwandte Inhalte

Feedback

Zusätzliche Ressourcen