Del via


Selvstudium: Brug en notesbog med Apache Spark til at forespørge en KQL-database

Notesbøger er både læsbare dokumenter, der indeholder beskrivelser af dataanalyser og resultater og eksekverbare dokumenter, der kan køres for at udføre dataanalyse. I denne artikel lærer du, hvordan du bruger en Microsoft Fabric-notesbog til at læse og skrive data til en KQL-database ved hjælp af Apache Spark. I dette selvstudium bruges forudoprettede datasæt og notesbøger i både realtidsintelligens og Dataudvikler miljøer i Microsoft Fabric. Du kan få flere oplysninger om notesbøger under Sådan bruger du Microsoft Fabric-notesbøger.

Specifikt lærer du, hvordan du:

  • Opret en KQL-database
  • Importér en notesbog
  • Skriv data til en KQL-database ved hjælp af Apache Spark
  • Forespørg om data fra en KQL-database

Forudsætninger

1 – Opret en KQL-database

  1. Vælg dit arbejdsområde på navigationslinjen til venstre.

  2. Følg et af disse trin for at begynde at oprette en hændelsesstream:

    • Vælg Nyt element, og derefter Eventhouse. I feltet Eventhouse-navn skal du angive nycGreenTaxiog derefter vælge Opret. Der oprettes en KQL-database med samme navn.
    • Vælg Databaseri et eksisterende hændelseshus. Under KQL-databaser vælge +i feltet KQL-databasenavn skal du angive nycGreenTaxiog derefter vælge Opret.
  3. Kopiér forespørgsels-URI'en fra kortet med databaseoplysninger i databasedashboardet, og indsæt den et eller andet sted, f.eks. en notesblok, som skal bruges på et senere trin.

     Skærmbillede af kortet med databaseoplysninger, der viser databasedetaljerne. Indstillingen Kopiér URI til forespørgsels-URI er fremhævet.

2 – Download NYC GreenTaxi-notesbogen

Vi har oprettet en eksempelnotesbog, der fører dig gennem alle de nødvendige trin til indlæsning af data i din database ved hjælp af Spark-connectoren.

  1. Åbn lageret med Fabric-eksempler på GitHub for at downloade NYC GreenTaxi KQL-notesbogen.

    Skærmbillede af GitHub-lageret, der viser notesbogen NYC GreenTaxi. Indstillingen Rå er fremhævet.

  2. Gem notesbogen lokalt på din enhed.

    Bemærk

    Notesbogen skal gemmes i filformatet .ipynb .

3 – Importér notesbogen

Resten af denne arbejdsproces finder sted i Dataudvikler sektionen af produktet og bruger en Spark-notesbog til at indlæse og forespørge om data i din KQL-database.

  1. Vælg Importér>notesbog>Fra denne computer>Upload vælg derefter den NYC GreenTaxi-notesbog, du downloadede i et tidligere trin.

    Skærmbillede af vinduet Importstatus. Knappen Upload er fremhævet.

  2. Når importen er fuldført, skal du åbne notesbogen fra dit arbejdsområde.

4 – Hent data

Hvis du vil forespørge din database ved hjælp af Spark-connectoren, skal du give læse- og skriveadgang til NYC GreenTaxi-blobobjektbeholderen.

Vælg afspilningsknappen for at køre følgende celler, eller markér cellen, og tryk på Skift+ Enter. Gentag dette trin for hver kodecelle.

Bemærk

Vent på, at fuldførelsesmærket vises, før du kører den næste celle.

  1. Kør følgende celle for at give adgang til NYC GreenTaxi-blobobjektbeholderen.

    Skærmbillede af den første kodecelle, der viser oplysninger om lageradgang.

  2. I KustoURI skal du indsætte den forespørgsels-URI , du kopierede tidligere , i stedet for pladsholderteksten.

  3. Skift navnet på pladsholderdatabasen til nycGreenTaxi.

  4. Skift navnet på pladsholdertabellen til GreenTaxiData.

    Skærmbillede af den anden kodecelle, der viser oplysningerne i måldatabasen. Forespørgsels-URI'en, databasenavnet og tabelnavnet er fremhævet.

  5. Kør cellen.

  6. Kør den næste celle for at skrive data til databasen. Det kan tage et par minutter, før dette trin er fuldført.

    Skærmbillede af tredje kodecelle, der viser tabeltilknytnings- og indtagelseskommandoen.

Der er nu indlæst data i databasen i en tabel med navnet GreenTaxiData.

5 – Kør notesbogen

Kør de resterende to celler sekventielt for at forespørge om data fra tabellen. Resultaterne viser de øverste 20 højeste og laveste taxapriser og afstande registreret efter år.

Skærmbillede af fjerde og femte kodecelle, der viser forespørgselsresultaterne.

6 – Ryd op i ressourcer

Ryd op i de elementer, der er oprettet, ved at navigere til det arbejdsområde, hvor de blev oprettet.

  1. Peg på den notesbog, du vil slette, i arbejdsområdet, og vælg menuen Flere [...] >Slet.

    Skærmbillede af arbejdsområde, der viser rullemenuen i notesbogen NYC GreenTaxi. Indstillingen Slet er fremhævet.

  2. Vælg Slet. Du kan ikke gendanne din notesbog, når du har slettet den.