Udostępnij za pośrednictwem


Nawiązywanie połączenia z usługą ADLS i przekształcanie danych za pomocą usługi Azure Databricks

W tym przewodniku wykonasz następujące elementy:

  • Utwórz tabelę delty na koncie usługi Azure Data Lake Storage (ADLS) Gen2 przy użyciu usługi Azure Databricks.

  • Utwórz skrót OneLake do tabeli delty w usłudze ADLS.

  • Usługa Power BI umożliwia analizowanie danych za pośrednictwem skrótu usługi ADLS.

Wymagania wstępne

Przed rozpoczęciem musisz mieć następujące elementy:

  • Obszar roboczy z elementem lakehouse

  • Obszar roboczy usługi Azure Databricks

  • Konto usługi ADLS Gen2 do przechowywania tabel delty

Tworzenie tabeli delty, tworzenie skrótu i analizowanie danych

  1. Korzystając z notesu usługi Azure Databricks, utwórz tabelę delty na koncie usługi ADLS Gen2.

     # Replace the path below to refer to your sample parquet data with this syntax "abfss://<storage name>@<container name>.dfs.core.windows.net/<filepath>"
    
     # Read Parquet files from an ADLS account
     df = spark.read.format('Parquet').load("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/full/dimension_city/")
    
     # Write Delta tables to ADLS account
     df.write.mode("overwrite").format("delta").save("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/adb_dim_city_delta/")
    
  2. W lakehouse wybierz wielokropek (...) obok pozycji Tabele , a następnie wybierz pozycję Nowy skrót.

    Zrzut ekranu przedstawiający lokalizację nowego skrótu w tabelach.

  3. Na ekranie Nowy skrót wybierz kafelek Azure Data Lake Storage Gen2 .

    Zrzut ekranu przedstawiający opcje kafelka na ekranie Nowy skrót.

  4. Określ szczegóły połączenia skrótu i wybierz przycisk Dalej.

    Zrzut ekranu przedstawiający miejsce wprowadzania ustawień połączenia dla nowego skrótu.

  5. Określ szczegóły skrótu. Podaj szczegóły nazwy skrótu i ścieżki podrzędnej, a następnie wybierz pozycję Utwórz. Ścieżka podrzędna powinna wskazywać katalog, w którym znajduje się tabela delty.

    Zrzut ekranu przedstawiający miejsce wprowadzania nowych szczegółów skrótu.

  6. Skrót jest wyświetlany jako tabela delty w obszarze Tabele.

    Zrzut ekranu przedstawiający lokalizację nowo utworzonego skrótu usługi ADLS.

  7. Teraz możesz wykonywać zapytania dotyczące tych danych bezpośrednio z notesu.

    df = spark.sql("SELECT * FROM lakehouse1.adls_shortcut_adb_dim_city_delta LIMIT 1000")
    display(df)
    
  8. Aby uzyskać dostęp do tej tabeli delty i przeanalizować je za pośrednictwem usługi Power BI, wybierz pozycję Nowy model semantyczny usługi Power BI.

    Zrzut ekranu przedstawiający sposób tworzenia nowego modelu semantycznego usługi Power BI.

  9. Wybierz skrót, a następnie wybierz pozycję Potwierdź.

    Zrzut ekranu przedstawiający nową konfigurację modelu semantycznego.

  10. Po opublikowaniu danych wybierz pozycję Rozpocznij od podstaw.

    Zrzut ekranu przedstawiający proces konfigurowania zestawu danych.

  11. W środowisku tworzenia raportu dane skrótów są wyświetlane jako tabela wraz ze wszystkimi jego atrybutami.

    Zrzut ekranu przedstawiający środowisko tworzenia i atrybuty tabeli.

  12. Aby utworzyć raport usługi Power BI, przeciągnij atrybuty do okienka po lewej stronie.

    Zrzut ekranu przedstawiający dane, których dotyczy zapytanie za pośrednictwem raportu usługi Power BI.