Übung: Auswählen der zurückzugebenden Spalten mithilfe des project-Operators
Sie können Kusto-Abfragen verwenden, um Daten zu filtern und bestimmte Informationen zurückzugeben.
Denken Sie daran, dass wir uns beliebige Datenzeilen angesehen haben, um einen Eindruck von der Struktur der Daten zu erhalten. In dieser Lerneinheit erfahren Sie, wie Sie bestimmte Datenspalten zu den Arten und Orten von Stürmen und den verursachten Schäden auswählen.
Verwenden Sie den project
-Operator
Wenn Sie sich erinnern, enthält das Beispiel mit den meteorologischen Daten einige Spalten. Nicht alle dieser Spalten sind für unsere Untersuchung relevant. Sie wählen nur einige Spalten für die Anzeige aus. Sie verwenden den project
-Operator, um zu definieren, welche Spalten in der Ausgabe angezeigt werden sollen. Spaltennamen werden durch Kommas getrennt.
Führen Sie die folgende Abfrage aus. In dieser Abfrage benennen wir die zurückzugebenden Spalten und deren Reihenfolge innerhalb des
project
-Operators.StormEvents | project EventType, State, DamageProperty, DamageCrops, InjuriesDirect, InjuriesIndirect | take 10
Sie sollten Ergebnisse erhalten, die wie in der folgenden Abbildung aussehen:
Beachten Sie, dass nur die im
project
-Operator genannten Spalten in der Ausgabe angezeigt werden.
Umbenennen und Definieren neuer Spalten mithilfe von project
Um die Auswirkungen von Stürmen in US-Bundesstaaten zu verstehen, möchten Sie die Gesamtzahl der Verletzten und die Höhe des Schadens abrufen. Mit dem project
-Operator können Sie ganzzahlige Werte aus verschiedenen Spalten addieren und die Ergebnisse in einer neuen Spalte zurückgeben. Sie können Spalten auch umbenennen, um sie für Ihre Analyse aussagekräftiger zu machen.
Es gibt beispielsweise auch andere Länder/Regionen mit Bundesstaaten. Daher kann es sinnvoll sein, die Spalte „State“ umzubenennen, damit klar ist, dass sich die Ergebnisse auf US-Bundesstaaten beziehen. Sehen wir uns an, wie Sie Ihre vorherige Abfrage so ändern, dass Sie die Gesamtzahl der Verletzten und die Höhe des Schadens für US-Bundesstaaten erhalten.
Aktualisieren Sie Ihre vorherige Abfrage, um eine neue Spalte zu erstellen, in der die Summe von InjuriesDirect und InjuriesIndirect angezeigt wird:
Injuries=InjuriesDirect+InjuriesIndirect
Gehen Sie bei den Spalten für die beiden Arten von Schäden entsprechend vor, indem Sie die Ernte- und Sachschäden addieren.
Damage=DamageCrops+DamageProperty
Zeigen Sie im Abfrage-Editor auf den Spaltennamen, um den in den Spalten enthaltenen Datentyp anzuzeigen. Sie können einen numerischen Operator verwenden, um die Werte zu addieren, da diese Spalten vom Typ
int
(ganze Zahl) sind.Benennen Sie die Spalte State in US_State um.
US_State=State
Überprüfen Sie Ihre aktualisierte Abfrage, und führen Sie sie aus. Die vollständige Abfrage umfasst Berechnungen für Verletzte, Berechnungen für Schäden und das Umbenennen der Spalte State.
StormEvents | project US_State=State, EventType, Injuries=InjuriesDirect+InjuriesIndirect, Damage=DamageCrops+DamageProperty | take 10
Sie sollten Ergebnisse erhalten, die wie in der folgenden Abbildung aussehen:
Wie Sie sehen, wurde die Spalte State in US_State umbenannt. Die Spalte Injuries ist neu hinzugekommen und berechnet sich aus der Summe von InjuriesDirect und InjuriesIndirect. Die Spalte Damage ist ebenfalls neu und berechnet sich aus der Summe von DamageCrops und DamageProperty.
Verwenden Sie den project-away
-Operator
Wie gehen Sie vor, wenn Sie einige bestimmte Spalten entfernen möchten? Für diese Untersuchung benötigen Sie die IDs nicht, die jeder Episode und jedem Ereignis zugewiesen sind. Sie können bestimmte Spalten mithilfe des project-away
-Operators entfernen, der angibt, welche Spalten entfernt werden sollen, während alle anderen Spalten beibehalten werden. Sie können auch einen Platzhalter wie | project-away *Id
verwenden, um alle Spalten zu entfernen, die auf Id enden.
Führen Sie die folgende Abfrage aus:
StormEvents | project-away EpisodeId, EventId | take 10
Überprüfen Sie die Ergebnisse. Wie Sie sich erinnern, befanden sich die Spalten EpisodeId und EventId zwischen den Spalten EndTime und State. Welche dieser Spalten werden in der Ausgabe angezeigt?