Übung: Auswählen der zurückzugebenden Spalten mithilfe des project-Operators

Abgeschlossen

Sie können Kusto-Abfragen verwenden, um Daten zu filtern und bestimmte Informationen zurückzugeben.

Denken Sie daran, dass wir uns beliebige Datenzeilen angesehen haben, um einen Eindruck von der Struktur der Daten zu erhalten. In dieser Lerneinheit erfahren Sie, wie Sie bestimmte Datenspalten zu den Arten und Orten von Stürmen und den verursachten Schäden auswählen.

Verwenden Sie den project-Operator

Wenn Sie sich erinnern, enthält das Beispiel mit den meteorologischen Daten einige Spalten. Nicht alle dieser Spalten sind für unsere Untersuchung relevant. Sie wählen nur einige Spalten für die Anzeige aus. Sie verwenden den project-Operator, um zu definieren, welche Spalten in der Ausgabe angezeigt werden sollen. Spaltennamen werden durch Kommas getrennt.

  1. Führen Sie die folgende Abfrage aus. In dieser Abfrage benennen wir die zurückzugebenden Spalten und deren Reihenfolge innerhalb des project-Operators.

    Abfrage ausführen

    StormEvents
    | project EventType, State, DamageProperty, DamageCrops, InjuriesDirect, InjuriesIndirect
    | take 10
    
  2. Sie sollten Ergebnisse erhalten, die wie in der folgenden Abbildung aussehen:

    Screenshot der Ergebnisse des project-Operators mit sechs Spalten

  3. Beachten Sie, dass nur die im project-Operator genannten Spalten in der Ausgabe angezeigt werden.

Umbenennen und Definieren neuer Spalten mithilfe von project

Um die Auswirkungen von Stürmen in US-Bundesstaaten zu verstehen, möchten Sie die Gesamtzahl der Verletzten und die Höhe des Schadens abrufen. Mit dem project-Operator können Sie ganzzahlige Werte aus verschiedenen Spalten addieren und die Ergebnisse in einer neuen Spalte zurückgeben. Sie können Spalten auch umbenennen, um sie für Ihre Analyse aussagekräftiger zu machen.

Es gibt beispielsweise auch andere Länder/Regionen mit Bundesstaaten. Daher kann es sinnvoll sein, die Spalte „State“ umzubenennen, damit klar ist, dass sich die Ergebnisse auf US-Bundesstaaten beziehen. Sehen wir uns an, wie Sie Ihre vorherige Abfrage so ändern, dass Sie die Gesamtzahl der Verletzten und die Höhe des Schadens für US-Bundesstaaten erhalten.

  1. Aktualisieren Sie Ihre vorherige Abfrage, um eine neue Spalte zu erstellen, in der die Summe von InjuriesDirect und InjuriesIndirect angezeigt wird:

    Injuries=InjuriesDirect+InjuriesIndirect

  2. Gehen Sie bei den Spalten für die beiden Arten von Schäden entsprechend vor, indem Sie die Ernte- und Sachschäden addieren.

    Damage=DamageCrops+DamageProperty

  3. Zeigen Sie im Abfrage-Editor auf den Spaltennamen, um den in den Spalten enthaltenen Datentyp anzuzeigen. Sie können einen numerischen Operator verwenden, um die Werte zu addieren, da diese Spalten vom Typ int (ganze Zahl) sind.

    Screenshot des Datentyps in einem Abfrage-Editor

  4. Benennen Sie die Spalte State in US_State um.

    US_State=State

  5. Überprüfen Sie Ihre aktualisierte Abfrage, und führen Sie sie aus. Die vollständige Abfrage umfasst Berechnungen für Verletzte, Berechnungen für Schäden und das Umbenennen der Spalte State.

    Abfrage ausführen

    StormEvents
    | project US_State=State, EventType, Injuries=InjuriesDirect+InjuriesIndirect, Damage=DamageCrops+DamageProperty
    | take 10
    
  6. Sie sollten Ergebnisse erhalten, die wie in der folgenden Abbildung aussehen:

    Screenshot der Abfrageergebnisse für einen project-Operator, der Spalten umbenennt

  7. Wie Sie sehen, wurde die Spalte State in US_State umbenannt. Die Spalte Injuries ist neu hinzugekommen und berechnet sich aus der Summe von InjuriesDirect und InjuriesIndirect. Die Spalte Damage ist ebenfalls neu und berechnet sich aus der Summe von DamageCrops und DamageProperty.

Verwenden Sie den project-away-Operator

Wie gehen Sie vor, wenn Sie einige bestimmte Spalten entfernen möchten? Für diese Untersuchung benötigen Sie die IDs nicht, die jeder Episode und jedem Ereignis zugewiesen sind. Sie können bestimmte Spalten mithilfe des project-away-Operators entfernen, der angibt, welche Spalten entfernt werden sollen, während alle anderen Spalten beibehalten werden. Sie können auch einen Platzhalter wie | project-away *Id verwenden, um alle Spalten zu entfernen, die auf Id enden.

  1. Führen Sie die folgende Abfrage aus:

    Abfrage ausführen

    StormEvents
    | project-away EpisodeId, EventId
    | take 10
    
  2. Überprüfen Sie die Ergebnisse. Wie Sie sich erinnern, befanden sich die Spalten EpisodeId und EventId zwischen den Spalten EndTime und State. Welche dieser Spalten werden in der Ausgabe angezeigt?