Provádění nulové analýzy ETL s využitím interaktivního dotazu HDInsight
Na konci tohoto modulu můžete provádět ad hoc dotazy na sadu velkých objemů dat. Použití interaktivního dotazu HDInsight pomáhá dosáhnout latencí podsekundových dotazů.
Cíle výuky
V tomto modulu se naučíte:
- Vhodné scénáře pro nasazení clusterů HDInsight Interactive Query
- Seznamte se se vzory architektury.
- Nasaďte cluster pro aplikaci nemovitostí a dotazujte se na data.
- Naučte se integrovat dotazy Apache Spark a Hive LLAP pomocí konektoru Hive Warehouse Connector.
- Vytvořte řídicí panel pro interaktivní dotazy ve velkém měřítku pro vyhodnocení hodnot a umístění nemovitostí.
Požadavky
Je třeba splňovat následující požadavky:
- Úspěšně se přihlaste k webu Azure Portal.
- Seznamte se s možnostmi úložiště Azure.
- Seznamte se s možnostmi výpočetních prostředků Azure.
- Vytvořte a nakonfigurujte cluster HDInsight na webu Azure Portal.