Sdílet prostřednictvím


Připojení k ADLS a transformace dat pomocí Azure Databricks

V této příručce:

  • Vytvořte tabulku Delta v účtu Azure Data Lake Storage (ADLS) Gen2 pomocí Azure Databricks.

  • Vytvořte zástupce OneLake tabulky Delta v ADLS.

  • Pomocí Power BI můžete analyzovat data prostřednictvím zástupce ADLS.

Požadavky

Než začnete, musíte mít:

  • Pracovní prostor s položkou Lakehouse

  • Pracovní prostor Azure Databricks

  • Účet ADLS Gen2 pro ukládání tabulek Delta

Vytvoření tabulky Delta, vytvoření zástupce a analýza dat

  1. Pomocí poznámkového bloku Azure Databricks vytvořte v účtu ADLS Gen2 tabulku Delta.

     # Replace the path below to refer to your sample parquet data with this syntax "abfss://<storage name>@<container name>.dfs.core.windows.net/<filepath>"
    
     # Read Parquet files from an ADLS account
     df = spark.read.format('Parquet').load("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/full/dimension_city/")
    
     # Write Delta tables to ADLS account
     df.write.mode("overwrite").format("delta").save("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/adb_dim_city_delta/")
    
  2. V jezeře vyberte tři tečky (...) vedle tabulky a pak vyberte Nová zkratka.

    Snímek obrazovky znázorňující umístění nového zástupce v tabulkách

  3. Na obrazovce Nová zkratka vyberte dlaždici Azure Data Lake Storage Gen2.

    Snímek obrazovky s možnostmi dlaždice na obrazovce Nová klávesová zkratka

  4. Zadejte podrobnosti o připojení pro zástupce a vyberte Další.

    Snímek obrazovky znázorňující, kde zadat nastavení připojení pro novou klávesovou zkratku

  5. Zadejte podrobnosti zástupce. Zadejte podrobnosti o názvu zástupce a dílčí cestě a pak vyberte Vytvořit. Podřízená cesta by měla odkazovat na adresář, ve kterém se nachází tabulka Delta.

    Snímek obrazovky znázorňující, kde zadat nové podrobnosti o zástupci

  6. Zástupce se zobrazí jako tabulka Delta v části Tabulky.

    Snímek obrazovky znázorňující umístění nově vytvořené klávesové zkratky ADLS

  7. Teď můžete tato data dotazovat přímo z poznámkového bloku.

    df = spark.sql("SELECT * FROM lakehouse1.adls_shortcut_adb_dim_city_delta LIMIT 1000")
    display(df)
    
  8. Pokud chcete získat přístup k této tabulce Delta a analyzovat ji prostřednictvím Power BI, vyberte Nový sémantický model Power BI.

    Snímek obrazovky znázorňující, jak vytvořit nový sémantický model Power BI

  9. Vyberte zástupce a pak vyberte Potvrdit.

    Snímek obrazovky znázorňující nastavení nového sémantického modelu

  10. Po publikování dat vyberte Začít od začátku.

    Snímek obrazovky znázorňující proces nastavení datové sady

  11. V prostředí pro vytváření sestav se zástupce data zobrazí jako tabulka spolu se všemi jeho atributy.

    Snímek obrazovky znázorňující možnosti vytváření obsahu a atributy tabulky

  12. Pokud chcete vytvořit sestavu Power BI, přetáhněte atributy do podokna na levé straně.

    Snímek obrazovky znázorňující dotazování dat prostřednictvím sestavy Power BI