Freigeben über


Abrufen von Daten aus OneLake

In diesem Artikel erfahren Sie, wie Sie Daten aus OneLake in eine neue oder vorhandene Tabelle abrufen.

Voraussetzungen

Dateipfad aus Lakehouse kopieren

  1. Wählen Sie in Ihrem Arbeitsbereich die Lakehouse-Umgebung mit der Datenquelle aus, die Sie verwenden möchten.

  2. Platzieren Sie den Cursor über die gewünschte Datei, und wählen Sie das Menü Weitere (...) aus, und wählen Sie dann Eigenschaftenaus.

    Wichtig

    • Ordnerpfade werden nicht unterstützt.
    • Platzhalter (*) werden nicht unterstützt.

    Screenshot des Dropdownmenüs einer Lakehouse-Datei. Die Option

  3. Wählen Sie unter URL das Symbol In Zwischenablage kopieren aus, und speichern Sie die URL an einer beliebigen Stelle, um sie in einem späteren Schritt wieder abzurufen.

    Screenshot des Eigenschaftenbereichs einer Lakehouse-Datei. Das Symbol

  4. Kehren Sie zu Ihrem Arbeitsbereich zurück, und wählen Sie eine KQL-Datenbank aus.

Quelle

  1. Wählen Sie auf dem unteren Menüband der KQL-Datenbank die Option Daten abrufen aus.

    Im Fenster Daten abrufen ist die Registerkarte Quelle ausgewählt.

  2. Wählen Sie die Datenquelle aus der verfügbaren Liste aus. In diesem Beispiel erfassen Sie Daten aus OneLake.

    Screenshot: Fenster „Daten abrufen“ mit ausgewählter Registerkarte „Quelle“

Konfigurieren

  1. Wählen Sie eine Zieltabelle aus. Wenn Sie Daten in eine neue Tabelle aufnehmen möchten, wählen Sie +Neue Tabelle aus, und geben Sie einen Tabellennamen ein.

    Anmerkung

    Tabellennamen können bis zu 1024 Zeichen umfassen, einschließlich Leerzeichen, alphanumerischer Zeichen, Bindestriche und Unterstriche. Sonderzeichen werden nicht unterstützt.

  2. Fügen Sie unter OneLake-Datei den Dateipfad des Lakehouse ein, den Sie unter Kopieren des Dateipfads aus Lakehouse kopiert haben.

    Anmerkung

    Sie können jeweils bis zu 10 Elemente von bis zu 1 GB unkomprimierte Größe hinzufügen.

    Screenshot der Registerkarte

  3. Klicken Sie auf Weiter.

Inspizieren

Die Registerkarte Untersuchen wird mit einer Vorschau der Daten geöffnet.

Um den Erfassungsprozess abzuschließen, wählen Sie Fertig stellen aus.

Screenshot der Registerkarte

Falls gewünscht:

  • Wählen Sie Befehlsanzeige aus, um die von Ihren Eingaben generierten automatischen Befehle anzuzeigen und zu kopieren.
  • Verwenden Sie die Schemadefinitionsdatei Dropdowndatei, um die Datei zu ändern, von der das Schema abgeleitet wird.
  • Ändern Sie das automatisch abgeleitete Datenformat, indem Sie das gewünschte Format aus der Dropdownliste auswählen. Weitere Informationen finden Sie unter Datenformate, die von Real-Time Intelligenceunterstützt werden.
  • Spaltenbearbeiten.
  • Lesen Sie den Abschnitt Erweiterte Optionen basierend auf dem Datentyp.

Spalten bearbeiten

Anmerkung

  • Bei tabellarischen Formaten (CSV, TSV, PSV) können Sie eine Spalte nicht zweimal zuordnen. Um die neue Spalte einer vorhandenen Spalte zuzuordnen, löschen Sie zuerst die neue Spalte.
  • Sie können keinen vorhandenen Spaltentyp ändern. Wenn Sie versuchen, einer Spalte ein anderes Format zuzuordnen, könnten Sie am Ende leere Spalten haben.

Die Änderungen, die Sie in einer Tabelle vornehmen können, hängen von den folgenden Parametern ab:

  • Tabellentyp ist neu oder vorhanden
  • Die Zuordnung ist neu oder vorhanden.
Tabellentyp Zuordnungstyp Verfügbare Anpassungen
Neue Tabelle Neue Zuordnung Spalte umbenennen, Datentyp ändern, Datenquelle ändern, Zuordnungstransformation, Spalte hinzufügen, Spalte löschen
Vorhandene Tabelle Neue Zuordnung Spalte hinzufügen (in der Sie dann den Datentyp ändern, umbenennen und aktualisieren können)
Vorhandene Tabelle Vorhandene Zuordnung nichts

Screenshot der spalten, die zur Bearbeitung geöffnet sind.

Zuordnungstransformationen

Einige Datenformatzuordnungen (Parquet, JSON und Avro) unterstützen einfache Transformationen während der Erfassung. Erstellen oder aktualisieren Sie zum Anwenden von Zuordnungstransformationen eine Spalte im Fenster Spalten bearbeiten.

Zuordnungstransformationen können für eine Spalte vom Typ "Zeichenfolge" oder "datetime" ausgeführt werden, wobei die Quelle den Datentyp "int" oder "long" aufweist. Die folgenden Zuordnungstransformationen werden unterstützt:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Erweiterte Optionen basierend auf dem Datentyp

Tabellarisch (CSV, TSV, PSV):

  • Wenn Sie Tabellenformate in eine bestehende Tabelle übernehmen, wählen Sie Erweitert>Tabellenschema beibehalten aus. Tabellarische Daten enthalten nicht unbedingt die Spaltennamen, die zum Zuordnen von Quelldaten zu den vorhandenen Spalten verwendet werden. Wenn diese Option aktiviert ist, erfolgt die Zuordnung nach Reihenfolge, und das Tabellenschema bleibt gleich. Wenn diese Option deaktiviert ist, werden neue Spalten für eingehende Daten erstellt, unabhängig von der Datenstruktur.

  • Wenn Sie die erste Zeile als Spaltennamen verwenden möchten, wählen Sie Erweitert>Erste Zeile ist Spaltenüberschrift.

    Screenshot der erweiterten CSV-Optionen.

JSON:

  • Um die Spaltenteilung von JSON-Daten zu ermitteln, wählen Sie Erweiterte>Geschachtelte Ebenenaus, von 1 bis 100.

  • Wenn Sie Erweitert>JSON-Zeilen mit Fehlern überspringen auswählen, werden die Daten im JSON-Format erfasst. Wenn Sie dieses Kontrollkästchen nicht ausgewählt lassen, werden die Daten im Multijson-Format aufgenommen.

    Screenshot der erweiterten JSON-Optionen.

Zusammenfassung

Im Datenvorbereitungsfenster sind alle drei Schritte mit grünen Häkchen gekennzeichnet, wenn der Datenimport erfolgreich abgeschlossen ist. Sie können eine Karte auswählen, um eine Abfrage durchzuführen, die aufgenommenen Daten löschen oder ein Dashboard mit der Zusammenfassung Ihrer Erfassung anzeigen.

Screenshot der Zusammenfassungsseite mit abgeschlossenem erfolgreichen Datenimport.