Jaa


Opetusohjelma: Kyselyjen tekeminen KQL-tietokannasta muistikirjan ja Apache Sparkin avulla

Muistikirjat ovat sekä luettavissa olevia asiakirjoja, jotka sisältävät tietoanalyysin kuvauksia ja tuloksia sekä suoritettavia tiedostoja tietojen analysointia varten. Tässä artikkelissa opit käyttämään Microsoft Fabric -muistikirjaa tietojen lukemiseen ja kirjoittamiseen KQL-tietokantaan Apache Sparkin avulla. Tässä opetusohjelmassa käytetään esi luotuja tietojoukkoja ja muistikirjoja sekä Reaaliaikainen tieto- että Tietotekniikka-ympäristöissä Microsoft Fabricissa. Lisätietoja muistikirjoista on ohjeaiheessa Microsoft Fabric -muistikirjojen käyttäminen.

Opit erityisesti

  • KQL-tietokannan luominen
  • Muistikirjan tuominen
  • Tietojen kirjoittaminen KQL-tietokantaan Apache Sparkin avulla
  • Tietojen kyseleminen KQL-tietokannasta

Edellytykset

  • Työtila, jossa on Microsoft Fabric -yhteensopiva kapasiteetti

1- KQL-tietokannan luominen

  1. Avaa siirtymisruudun alareunassa oleva käyttökokemuksen vaihtaja ja valitse Reaaliaikaiset tiedot.

  2. Valitse KQL-tietokannan ruutu.

    Näyttökuva uudesta KQL-tietokannan ruudusta reaaliaikaisessa älykkyydessä.

  3. Kirjoita KQL-tietokannan nimi -kenttään nycGreenTaxi ja valitse sitten Luo.

    KQL-tietokanta luodaan valitun työtilan kontekstissa.

  4. Kopioi kyselyn URI tietokannan tietokortista tietokannan koontinäytöstä ja liitä se jonnekin, kuten muistioon, jotta sitä voidaan käyttää myöhemmässä vaiheessa.

     Näyttökuva tietokannan tietokortista, joka näyttää tietokannan tiedot. Kyselyn URI-asetus nimeltä Kopioi URI on korostettuna.

2- Lataa NYC GreenTaxi notebook

Olemme luoneet mallimuistikirjan, jossa käydään läpi kaikki tarvittavat vaiheet tietojen lataamiseksi tietokantaan Spark-liittimen avulla.

  1. Lataa NYC GreenTaxi KQL -muistikirja avaamalla Fabric-mallisäilön GitHubissa.

    Näyttökuva GitHub-säilöstä, jossa näkyy NYC GreenTaxi -muistikirja. Raaka-vaihtoehto näkyy korostettuna.

  2. Tallenna muistikirja paikallisesti laitteeseesi.

    Muistiinpano

    Muistikirja on tallennettava tiedostomuodossa .ipynb .

3- Tuo muistikirja

Tämän työnkulun loppuosa tapahtuu tuotteen Tietotekniikka-osassa , ja se käyttää Spark-muistikirjaa tietojen lataamiseen ja kyselemiseen KQL-tietokannassasi.

  1. Avaa siirtymisruudun alareunassa oleva käyttökokemuksen vaihtaja, valitse Kehitä ja sitten työtila.

  2. Valitse Tuo>muistikirja>tästä tietokoneesta>Lataa ja valitse sitten edellisessä vaiheessa lataamasi NYC GreenTaxi -muistikirja.

    Näyttökuva Tuonnin tila -ikkunasta. Lataa-painike näkyy korostettuna.

  3. Kun tuonti on valmis, avaa muistikirja työtilastasi.

4- Nouda tiedot

Jos haluat tehdä tietokantakyselyn Spark-liittimen avulla, sinun on annettava luku- ja kirjoitusoikeudet NYC GreenTaxi blob -säilöön.

Suorita seuraavat solut valitsemalla toistopainike tai valitse solu ja paina Vaihto+ Enter -näppäintä. Toista tämä vaihe jokaisen koodisolun kohdalla.

Muistiinpano

Odota, että valmistumisen valintamerkki tulee näkyviin ennen seuraavan solun suorittamista.

  1. Suorita seuraava solu, jotta voit ottaa käyttöön NYC GreenTaxi blob -säilön.

    Näyttökuva ensimmäisestä koodisolusta, joka näyttää tallennustilan käyttötiedot.

  2. Liitä KustoURI:ssa aiemmin kopioimasi kyselyn URI-osoite paikkamerkkitekstin sijaan.

  3. Muuta paikkamerkkitietokannan nimeksi nycGreenTaxi.

  4. Muuta paikkamerkkitaulukon nimeksi GreenTaxiData.

    Toisen koodisolun näyttökuva, jossa näkyvät kohdetietokannan tiedot. Kyselyn URI, tietokannan nimi ja taulukon nimi korostetaan.

  5. Suorita solu.

  6. Kirjoita tiedot tietokantaan suorittamalla seuraava solu. Tämän vaiheen suorittaminen voi kestää muutamia minuutteja.

    Näyttökuva kolmannesta koodisolusta, joka näyttää taulukon yhdistämismäärityksen ja käsittelykomennon.

Tietokannassa on nyt tietoja ladattuna taulukkoon nimeltä GreenTaxiData.

5- Suorita muistikirja

Suorita loput kaksi solua peräkkäin tietojen kyselemiseksi taulukosta. Tulokset näyttävät 20 suurinta ja alhaisimmat taksihinnat ja etäisyydet vuoden mukaan.

Näyttökuva neljännen ja viidennen koodisolun koodista, joka näyttää kyselyn tulokset.

6- Tyhjennä resurssit

Tyhjennä luodut kohteet siirtymällä työtilaan, jossa ne on luotu.

  1. Siirrä työtilassa hiiren osoitin poistettavan muistikirjan päälle, valitse Lisää-valikko [...] >Poista.

    Näyttökuva työtilasta, jossa näkyy NEWC GreenTaxi -muistikirjan avattava valikko. Asetus nimeltä Poista näkyy korostettuna.

  2. Valitse Poista. Muistikirjaa ei voi palauttaa, kun se on poistettu.