Erstellen einer Event Hubs-Datenverbindung für Azure Data Explorer
Azure Data Explorer ermöglicht die Datenerfassung aus Event Hubs. Dabei handelt es sich um eine Big-Data-Streamingplattform und einen Ereigniserfassungsdienst. Event Hubs kann Millionen von Ereignissen pro Sekunde nahezu in Echtzeit verarbeiten.
In diesem Artikel stellen Sie eine Verbindung mit einem Event Hub her und erfassen Daten in Azure Data Explorer. Eine Übersicht über die Erfassung aus Event Hubs finden Sie unter Azure Event Hubs-Datenverbindung.
Informationen zum Erstellen der Verbindung mithilfe der Kusto-SDKs finden Sie unter Erstellen einer Event Hubs-Datenverbindung mit SDKs.
Codebeispiele, die auf früheren SDK-Versionen basieren, finden Sie im archivierten Artikel.
Erstellen einer Event Hub-Datenverbindung
In diesem Abschnitt richten Sie eine Verbindung zwischen dem Event Hub und Ihrer Azure Data Explorer-Tabelle ein. Solange diese Verbindung besteht, werden Daten vom Event Hub in Ihre Zieltabelle übertragen. Wenn der Event Hub in eine andere Ressource oder ein anderes Abonnement verschoben wird, müssen Sie die Verbindung aktualisieren oder neu erstellen.
Voraussetzungen
- Ein Microsoft-Konto oder eine Microsoft Entra-Benutzeridentität. Ein Azure-Abonnement ist nicht erforderlich.
- Schnellstart: Erstellen eines Azure Data Explorer-Clusters und einer Datenbank. Erstellen eines Clusters und einer Datenbank
- Die Streamingaufnahme muss auf Ihrem Azure Data Explorer-Cluster konfiguriert werden.
Datensammlung
Wählen Sie im linken Menü " Abfrage" aus.
Klicken Sie mit der rechten Maustaste auf die Datenbank, in der Sie die Daten aufnehmen möchten. Wählen Sie Daten abrufen.
Quelle
Im Fenster Daten abrufen ist die Registerkarte Quelle ausgewählt.
Wählen Sie die Datenquelle aus der verfügbaren Liste aus. In diesem Beispiel nehmen Sie Daten aus Event Hubsauf.
Konfigurieren
Wählen Sie eine Zieldatenbank und -tabelle aus. Wenn Sie Daten in einer neuen Tabelle erfassen möchten, wählen Sie +Neue Tabelle aus, und geben Sie einen Tabellennamen ein.
Hinweis
Tabellennamen können bis zu 1024 Zeichen umfassen und alphanumerische Zeichen, Bindestriche und Unterstriche enthalten. Sonderzeichen werden nicht unterstützt.
Füllen Sie die folgenden Felder aus:
Einstellung Feldbeschreibung Abonnement Die Abonnement-ID, unter der sich die Event Hub-Ressource befindet Event Hub-Namespace Der Name, der Ihren Namespace bezeichnet Event Hub Der Event Hub, den Sie wünschen Consumergruppe Die in Ihrem Ereignis definierte Verbrauchergruppe Name der Datenverbindung Der Name, der Ihre Datenverbindung bezeichnet Erweiterte Filter Komprimierung Der Komprimierungstyp der Event Hub-Nachrichtennutzlast. Ereignissystemeigenschaften Die Event Hub-Systemeigenschaften. Wenn pro Ereignisnachricht mehrere Datensätze vorhanden sind, werden die Systemeigenschaften dem ersten Datensatz hinzugefügt. Beim Hinzufügen von Systemeigenschaften erstellen oder aktualisieren Sie das Tabellenschema und die Zuordnung, um die ausgewählten Eigenschaften einzubeziehen. Startdatum des Ereignisabrufs Die Datenverbindung ruft vorhandene Event Hubs-Ereignisse ab, die nach dem Startdatum des Ereignisabrufs erstellt wurden. Es können nur Ereignisse abgerufen werden, die vom Aufbewahrungszeitraum von Event Hubs aufbewahrt werden. Wenn das Startdatum des Ereignisabrufs nicht angegeben ist, ist die Standardzeit die Uhrzeit, zu der die Datenverbindung erstellt wird. Klicken Sie auf Weiter.
Inspizieren
Die Registerkarte Prüfen wird mit einer Vorschau der Daten geöffnet.
Um den Erfassungsvorgang abzuschließen, wählen Sie Fertig stellen aus.
Optional:
Sind die im Vorschaufenster angezeigten Daten nicht vollständig, benötigen Sie möglicherweise mehr Daten, um eine Tabelle mit allen erforderlichen Datenfeldern zu erstellen. Verwenden Sie die folgenden Befehle, um neue Daten aus Ihrem Event Hub abzurufen:
Verwerfen und Abrufen neuer Daten: Verwirft die angezeigten Daten und sucht nach neuen Ereignissen.
Fetch more data (Weitere Daten abrufen): Zusätzlich zu den bereits gefundenen Ereignissen wird nach weiteren Ereignissen gesucht.
Hinweis
Damit Sie eine Vorschau Ihrer Daten anzeigen können, muss Ihr Event Hub Ereignisse senden.
Wählen Sie die Befehlsanzeige, um die aus Ihren Eingaben generierten automatischen Befehle anzuzeigen und zu kopieren.
Verwenden Sie die Dateidropdownliste Schemadefinition, um die Datei zu ändern, von der das Schema abgeleitet wird.
Ändern Sie das automatisch abgeleitete Datenformat, indem Sie das gewünschte Format aus der Dropdownliste auswählen. Informationen zum Aufnehmen finden Sie unter Datenformate, die vom Azure-Daten-Explorer unterstützt werden.
Erkunden Sie Erweiterte Optionen basierend auf dem Datentyp.
Bearbeiten von Spalten
Hinweis
- Bei Tabellenformaten (CSV, TSV, PSV) können Sie eine Spalte nicht zweimal zuordnen. Löschen Sie bei einer Zuordnung zu einer vorhandenen Spalte zunächst die neue Spalte.
- Der Typ einer vorhandenen Spalte kann nicht geändert werden. Wenn Sie als Zuordnungsziel eine Spalte mit einem anderen Format verwenden, erhalten Sie ggf. leere Spalten.
Die Änderungen, die Sie an einer Tabelle vornehmen können, hängen von den folgenden Parametern ab:
- Die Tabelle ist neu oder vorhanden.
- Die Zuordnung ist neu oder vorhanden.
Tabellentyp | Zuordnungstyp | Verfügbare Anpassungen |
---|---|---|
Neue Tabelle | Neue Zuordnung | Spalte umbenennen, Datentyp ändern, Datenquelle ändern, Zuordnungstransformation, Spalte hinzufügen, Spalte löschen |
Vorhandene Tabelle | Neue Zuordnung | Spalte hinzufügen (für die Sie dann den Datentyp ändern und die Sie umbenennen und aktualisieren können) |
Vorhandene Tabelle | Vorhandene Zuordnung | keine |
Zuordnungstransformationen
Einige der Datenformatzuordnungen (Parquet, JSON und Avro) unterstützen einfache Transformationen während der Erfassung. Erstellen oder aktualisieren Sie zum Anwenden von Zuordnungstransformationen eine Spalte im Fenster Spalten bearbeiten.
Zuordnungstransformationen können für eine Spalte ausgeführt werden, für die als Typ der Wert „string“ oder „datetime“ und für Quelle der Datentyp „int“ oder „long“ angegeben ist. Die folgenden Zuordnungstransformationen werden unterstützt:
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconds
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
Erweiterte Optionen basierend auf dem Datentyp
Tabellarisch (CSV, TSV, PSV):
Wenn Sie tabellarische Formate in einer vorhandenen Tabelle aufnehmen, können Sie "Erweitertes>Aktuelles Tabellenschema beibehalten" auswählen. Tabellendaten enthalten nicht unbedingt die Spaltennamen, die verwendet werden, um Quelldaten den vorhandenen Spalten zuzuordnen. Wenn diese Option aktiviert ist, wird die Zuordnung nach der geltenden Reihenfolge durchgeführt, und das Tabellenschema bleibt unverändert. Wenn diese Option deaktiviert ist, werden unabhängig von der Datenstruktur neue Spalten für eingehende Daten erstellt.
Wählen Sie Erweitert>Erste Zeile ist Spaltenüberschrift, um die erste Zeile als Spaltennamen zu verwenden.
JSON:
Wählen Sie Erweitert>Verschachtelte Ebenen, von 1 bis 100, um die Spaltenaufteilung der JSON-Daten festzulegen.
Wenn Sie "Erweitertes>Ignorieren von Datenformatfehlern" auswählen, werden die Daten im JSON-Format aufgenommen. Wenn Sie das Kontrollkästchen nicht aktivieren, werden die Daten im MultiJSON-Format erfasst.
Zusammenfassung
Im Fenster Datenaufbereitung werden alle drei Schritte mit grünen Häkchen markiert, wenn die Datenerfassung erfolgreich abgeschlossen wurde. Sie können die Befehle anzeigen, die für jeden Schritt verwendet wurden, oder eine Karte zum Abfragen, Visualisieren oder Ablegen der aufgenommenen Daten auswählen.
Entfernen einer Event Hub-Datenverbindung
Entfernen Sie die Datenverbindung über die Azure-Portal, wie auf der Registerkarte "Portal" erläutert.
Zugehöriger Inhalt
- Überprüfen der Verbindung mit der Event Hub-App für Beispielnachrichten
- Abfragen von Daten in der Webbenutzeroberfläche