Dela via


Självstudie: Använda en notebook-fil med Apache Spark för att fråga en KQL-databas

Notebook-filer är både läsbara dokument som innehåller beskrivningar av dataanalys och resultat och körbara dokument som kan köras för att utföra dataanalys. I den här artikeln får du lära dig hur du använder en Microsoft Fabric-notebook-fil för att läsa och skriva data till en KQL-databas med Apache Spark. I den här självstudien används förskapade datauppsättningar och notebook-filer i både realtidsinformation och Dataingenjör miljöer i Microsoft Fabric. Mer information om notebook-filer finns i Använda Microsoft Fabric-notebook-filer.

Mer specifikt lär du dig att:

  • Skapa en KQL-databas
  • Importera en notebook-fil
  • Skriva data till en KQL-databas med Apache Spark
  • Fråga efter data från en KQL-databas

Förutsättningar

1 – Skapa en KQL-databas

  1. Öppna upplevelseväxlaren längst ned i navigeringsfönstret och välj Realtidsinformation.

  2. Välj KQL Database-panelen.

    Skärmbild av den nya KQL-databaspanelen i Realtidsinformation.

  3. I fältet KQL-databasnamn anger du nycGreenTaxi och väljer sedan Skapa.

    KQL-databasen skapas i kontexten för den valda arbetsytan.

  4. Kopiera fråge-URI:n från databasinformationskortet på databasinstrumentpanelen och klistra in den någonstans, som ett anteckningsblock, som ska användas i ett senare steg.

     Skärmbild av databasinformationskortet som visar databasinformationen. Alternativet Fråge-URI med titeln Kopiera URI är markerat.

2 - Ladda ner NYC GreenTaxi Notebook

Vi har skapat en exempelanteckningsbok som tar dig igenom alla nödvändiga steg för att läsa in data i databasen med spark-anslutningsappen.

  1. Öppna lagringsplatsen Infrastrukturexempel på GitHub för att ladda ned NOTEBOOK-filen NYC GreenTaxi KQL.

    Skärmbild av GitHub-lagringsplatsen som visar NOTEBOOK-filen NYC GreenTaxi. Alternativet Rådata är markerat.

  2. Spara anteckningsboken lokalt på enheten.

    Kommentar

    Anteckningsboken .ipynb måste sparas i filformatet.

3 – Importera anteckningsboken

Resten av det här arbetsflödet sker i avsnittet Dataingenjör ing i produkten och använder en Spark-notebook-fil för att läsa in och fråga efter data i din KQL-databas.

  1. Öppna upplevelseväxlaren längst ned i navigeringsfönstret och välj Utveckla och sedan din arbetsyta.

  2. Välj Importera>anteckningsbok>Från den här datorn>Ladda upp och välj sedan anteckningsboken NYC GreenTaxi som du laddade ned i ett tidigare steg.

    Skärmbild av fönstret Importera status. Knappen Ladda upp är markerad.

  3. När importen är klar öppnar du anteckningsboken från arbetsytan.

4 – Hämta data

Om du vill köra frågor mot databasen med Spark-anslutningsappen måste du ge läs- och skrivåtkomst till BLOB-containern NYC GreenTaxi.

Välj uppspelningsknappen för att köra följande celler eller välj cellen och tryck på Skift+ Retur. Upprepa det här steget för varje kodcell.

Kommentar

Vänta tills kryssmarkeringen för slutförande visas innan du kör nästa cell.

  1. Kör följande cell för att aktivera åtkomst till NYC GreenTaxi-blobcontainern.

    Skärmbild av den första kodcellen som visar information om lagringsåtkomst.

  2. I KustoURI klistrar du in fråge-URI:n som du kopierade tidigare i stället för platshållartexten.

  3. Ändra platshållardatabasnamnet till nycGreenTaxi.

  4. Ändra platshållartabellens namn till GreenTaxiData.

    Skärmbild av den andra kodcellen som visar måldatabasinformationen. Fråge-URI, databasnamn och tabellnamn är markerade.

  5. Kör cellen.

  6. Kör nästa cell för att skriva data till databasen. Det kan ta några minuter innan det här steget har slutförts.

    Skärmbild av den tredje kodcellen som visar kommandot för tabellmappning och inmatning.

Databasen har nu data som lästs in i en tabell med namnet GreenTaxiData.

5 – Kör notebook-filen

Kör de återstående två cellerna sekventiellt för att fråga efter data från tabellen. Resultaten visar de 20 högsta och lägsta taxipriserna och avstånden som registrerats per år.

Skärmbild av den fjärde och femte kodcellen som visar frågeresultatet.

6 – Rensa resurser

Rensa de objekt som skapats genom att navigera till arbetsytan där de skapades.

  1. Hovra över anteckningsboken som du vill ta bort på arbetsytan och välj menyn Mer [...] >Ta bort.

    Skärmbild av arbetsytan som visar den nedrullningsbara menyn i anteckningsboken NYC GreenTaxi. Alternativet Ta bort är markerat.

  2. Välj Ta bort. Du kan inte återställa anteckningsboken när du har tagit bort den.