Jaa


Tietojen käyttö OneLakeen ja analysointi Azure Databricksin avulla

Tässä oppaassa teet:

  • Luo jakso työtilassa ja käytä tietoja OneLake-muodossa Delta-muodossa.

  • Lue Ja muokkaa Delta-taulukkoa OneLakessa Azure Databricksin avulla.

Edellytykset

Ennen kuin aloitat, sinulla on oltava seuraavat:

  • Työtila, jossa on Lakehouse-kohde.

  • Azure Databricksin premium-työtila. Vain Azure Databricksin premium-työtilat tukevat Microsoft Entran tunnistetietojen läpivientiä. Kun luot klusteria, ota Azure Data Lake Storage tunnistetietojen läpikäynti käyttöön lisäasetuksissa.

  • Mallitietojoukko.

Tietojen käyttö ja Delta-taulukon muokkaaminen

  1. Siirry Lakehouse-kohtaan Power BI -palvelussa, valitse Nouda tiedot ja valitse sitten Uusi tietoputki.

    Näyttökuva, jossa näytetään, miten voit siirtyä uuteen tietoputkiasetukseen käyttöliittymässä.

  2. Kirjoita Uusi putki -kehotteeseen uuden putken nimi ja valitse sitten Luo.

  3. Valitse tässä harjoituksessa New Yorkin kaupungin taksi - vihreä mallitiedot tietolähteeksi ja valitse sitten Seuraava.

    Näyttökuva, jossa näytetään, miten voit valita semanttisen mallin NYC-mallista.

  4. Valitse esikatselunäytössä Seuraava.

  5. Valitse datakohteeksi sen lakehousen nimi, jota haluat käyttää OneLake Delta -taulukon tietojen tallentamiseen. Voit valita aiemmin luodun lakehousen tai luoda uuden.

    Näyttökuva, jossa näytetään, miten voit valita kohteen Lakehouse.

  6. Valitse tulosteen tallentumiseen haluamasi kohdesijainnit. Valitse Pääkansioksi Taulukot ja kirjoita taulukon nimeksi "nycsample".

  7. Valitse Tarkista + tallenna -näytössä aloita tiedonsiirto heti ja valitse sitten Tallenna + Suorita.

    Näyttökuva, jossa näytetään, miten voit kirjoittaa taulukon nimen.

  8. Kun työ on valmis, siirry Lakehouse-tallennustilaan ja tarkastele /Tables-kansiossa olevaa delta-taulukkoa.

  9. Napsauta hiiren kakkospainikkeella luodun taulukon nimeä, valitse Ominaisuudet ja kopioi Azure Blob Filesystem (ABFS) -polku.

  10. Avaa Azure Databricks -muistikirjasi. Lue OneLaken Delta-taulukko.

    olsPath = "abfss://<replace with workspace name>@onelake.dfs.fabric.microsoft.com/<replace with item name>.Lakehouse/Tables/nycsample" 
    df=spark.read.format('delta').option("inferSchema","true").load(olsPath)
    df.show(5)
    
  11. Päivitä Delta-taulukon tiedot muuttamalla kentän arvoa.

    %sql
    update delta.`abfss://<replace with workspace name>@onelake.dfs.fabric.microsoft.com/<replace with item name>.Lakehouse/Tables/nycsample` set vendorID = 99999 where vendorID = 1;