Cvičení – výběr sloupců k vrácení pomocí operátoru projektu
Pomocí dotazů Kusto můžete filtrovat data a vracet konkrétní informace.
Vzpomeňte si, že jste se podívali na libovolné řádky dat, abyste získali představu o datové struktuře. V této lekci se dozvíte, jak vybrat konkrétní datové sloupce, které se vztahují k typům bouře, umístěním a škodlivým účinkům.
Použití operátoru project
Pokud si pamatujete, v příkladu meteorologických dat je poměrně málo sloupců. Ne všechny tyto sloupce jsou pro toto zkoumání smysluplné. Pro zobrazení zvolíte jenom několik sloupců. Operátor použijete project
k definování sloupců, které chcete zobrazit ve výstupu. Názvy sloupců jsou oddělené čárkami.
Spusťte následující dotaz. Tento dotaz pojmenuje sloupce, které mají být vráceny, a jejich pořadí v rámci operátoru
project
.StormEvents | project EventType, State, DamageProperty, DamageCrops, InjuriesDirect, InjuriesIndirect | take 10
Měli byste získat výsledky, které vypadají jako na následujícím obrázku:
Všimněte si, že ve výstupu
project
se zobrazí pouze sloupce uvedené v operátoru.
Přejmenování a definování nových sloupců pomocí project
Chcete-li porozumět dopadům bouřek v USA, chcete získat celkový počet zranění a celkové množství škod. Pomocí operátoru project
můžete sečíst celočíselné hodnoty z různých sloupců a vrátit výsledky do nového sloupce. Sloupce můžete také přejmenovat, aby byly smysluplnější pro vaši analýzu.
Existují například další země nebo oblasti se státy. Může být užitečné přejmenovat sloupec stavu, aby bylo jasné, že výsledky jsou pro státy USA. Pojďme se podívat, jak změnit předchozí dotaz, abyste získali celkový počet zranění a množství škod ve státech USA.
Aktualizujte předchozí dotaz tak, aby vytvořil nový sloupec, který zobrazuje součet ZraněníDirect a InjuriesIndirect:
Injuries=InjuriesDirect+InjuriesIndirect
Stejný postup proveďte u dvou typů sloupců poškození tak, že seskupíte škody na plodinách a poškození majetku:
Damage=DamageCrops+DamageProperty
Najeďte myší na název sloupce v editoru dotazů, abyste viděli datový typ obsažený ve sloupcích. K přidání hodnot můžete použít číselný operátor, protože tyto sloupce jsou typu
int
(celé číslo).Přejmenujte sloupec State na US_State:
US_State=State
Zkontrolujte aktualizovaný dotaz a spusťte ho. Úplný dotaz zahrnuje výpočty zranění, výpočty škod a přejmenování sloupce Stát .
StormEvents | project US_State=State, EventType, Injuries=InjuriesDirect+InjuriesIndirect, Damage=DamageCrops+DamageProperty | take 10
Měli byste získat výsledky, které vypadají jako na následujícím obrázku:
Všimněte si, že sloupec Stát byl přejmenován na US_State. Sloupec Zranění je nový a byl vypočítán jako součet ZraněníDirect a InjuriesIndirect. Sloupec Poškození je také nový a byl vypočítán jako součet DamageCrops a DamageProperty.
Použití operátoru project-away
Co když chcete odebrat několik vybraných sloupců? Pro účely tohoto průzkumu nemáte žádné použití pro ID přiřazená k jednotlivým epizodám a událostem. Konkrétní sloupce můžete odebrat pomocí operátoru project-away
, který označuje, které sloupce se mají odebrat, a přitom ponechat všechny zbývající sloupce. Můžete také použít zástupný znak, například | project-away *Id
, k odebrání všech sloupců, které končí ID.
Spusťte tento dotaz:
StormEvents | project-away EpisodeId, EventId | take 10
Zkontrolujte výsledky. Vzpomeňte si, že sloupce EpisodeId a EventId byly mezi sloupci EndTime a State . Které z těchto sloupců vidíte ve výstupu?