Sdílet prostřednictvím


Kurz: Použití poznámkového bloku s Apache Sparkem k dotazování databáze KQL

Poznámkové bloky jsou čitelné dokumenty obsahující popisy analýzy dat a výsledky a spustitelné dokumenty, které je možné spustit za účelem analýzy dat. V tomto článku se dozvíte, jak pomocí poznámkového bloku Microsoft Fabric číst a zapisovat data do databáze KQL pomocí Apache Sparku. Tento kurz používá předem vytvořenou datovou sadu a poznámkové bloky v reálném čase i v prostředích Datoví technici v Microsoft Fabric. Další informace o poznámkových blocích najdete v tématu Použití poznámkových bloků Microsoft Fabric.

Konkrétně se naučíte:

  • Vytvoření databáze KQL
  • Import poznámkového bloku
  • Zápis dat do databáze KQL pomocí Apache Sparku
  • Dotazování dat z databáze KQL

Požadavky

1. Vytvoření databáze KQL

  1. Otevřete přepínač prostředí v dolní části navigačního podokna a vyberte Inteligentní funkce v reálném čase.

  2. Vyberte dlaždici Databáze KQL.

    Snímek obrazovky s novou dlaždicí databáze KQL ve inteligentním čase v reálném čase

  3. Do pole Název databáze KQL zadejte nycGreenTaxi a pak vyberte Vytvořit.

    Databáze KQL se vytvoří v kontextu vybraného pracovního prostoru.

  4. Zkopírujte identifikátor URI dotazu z karty podrobností databáze na řídicím panelu databáze a vložte ho někam, jako je poznámkový blok, abyste ho mohli použít v pozdějším kroku.

     Snímek obrazovky s kartou s podrobnostmi databáze, která zobrazuje podrobnosti databáze Je zvýrazněná možnost Identifikátor URI dotazu s názvem Kopírovat identifikátor URI.

2. Stáhněte si poznámkový blok NYC GreenTaxi

Vytvořili jsme ukázkový poznámkový blok, který vás provede všemi potřebnými kroky pro načtení dat do databáze pomocí konektoru Spark.

  1. Otevřete úložiště ukázek Prostředků infrastruktury na GitHubu a stáhněte si poznámkový blok NYC GreenTaxi KQL.

    Snímek obrazovky úložiště GitHub zobrazující poznámkový blok NYC GreenTaxi Možnost Nezpracovaný je zvýrazněná.

  2. Uložte poznámkový blok místně do zařízení.

    Poznámka:

    Poznámkový blok musí být uložen ve .ipynb formátu souboru.

3. Import poznámkového bloku

Zbytek tohoto pracovního postupu se vyskytuje v části Datoví technici produktu a používá poznámkový blok Spark k načtení a dotazování dat v databázi KQL.

  1. Otevřete přepínač prostředí v dolní části navigačního podokna a vyberte Vývoj a pak pracovní prostor.

  2. Vyberte Importovat>poznámkový blok>z tohoto počítače>Nahrát a pak zvolte poznámkový blok NYC GreenTaxi, který jste stáhli v předchozím kroku.

    Snímek obrazovky s oknem Stav importu Tlačítko s názvem Nahrát je zvýrazněné.

  3. Po dokončení importu otevřete poznámkový blok z pracovního prostoru.

4. Získání dat

Pokud chcete dotazovat databázi pomocí konektoru Spark, musíte udělit přístup pro čtení a zápis ke kontejneru objektů blob NYC GreenTaxi.

Vyberte tlačítko přehrát, aby se spustily následující buňky, nebo vyberte buňku a stiskněte Shift+Enter. Tento krok opakujte pro každou buňku kódu.

Poznámka:

Před spuštěním další buňky počkejte, než se zobrazí značka zaškrtnutí dokončení.

  1. Spuštěním následující buňky povolte přístup ke kontejneru objektů blob NYC GreenTaxi.

    Snímek obrazovky s první buňkou kódu zobrazující informace o přístupu k úložišti

  2. Do kustoURI vložte identifikátor URI dotazu, který jste zkopírovali dříve , místo zástupného textu.

  3. Změňte název zástupné databáze na nycGreenTaxi.

  4. Změňte název zástupné tabulky na GreenTaxiData.

    Snímek obrazovky s druhou buňkou kódu zobrazující informace o cílové databázi Zvýrazní se identifikátor URI dotazu, název databáze a název tabulky.

  5. Spusťte buňku.

  6. Spuštěním další buňky zapište data do databáze. Dokončení tohoto kroku může trvat několik minut.

    Snímek obrazovky s buňkou třetího kódu zobrazující mapování tabulek a příkaz pro příjem dat

Databáze teď obsahuje data načtená do tabulky s názvem GreenTaxiData.

5. Spuštění poznámkového bloku

Spusťte zbývající dvě buňky postupně a dotazujte se na data z tabulky. Výsledky ukazují prvních 20 nejvyšších a nejnižších jízdných taxíků a vzdáleností zaznamenaných podle roku.

Snímek obrazovky se čtvrtou a pátou buňkou kódu zobrazující výsledky dotazu

6. Vyčištění prostředků

Vyčistěte položky vytvořené tak, že přejdete do pracovního prostoru, ve kterém byly vytvořeny.

  1. V pracovním prostoru najeďte myší na poznámkový blok, který chcete odstranit, vyberte nabídku Další [...] >Odstranit.

    Snímek obrazovky pracovního prostoru s rozevírací nabídkou poznámkového bloku NYC GreenTaxi Zvýrazněná možnost Odstranit

  2. Vyberte Odstranit. Jakmile poznámkový blok odstraníte, nemůžete ho obnovit.