Moduuli 2: Tietojen muuntaminen tietovuon avulla Data Factoryssa
Tässä moduulissa kestää noin 25 minuuttia luoda tietovuo, soveltaa muunnoksia ja siirtää raakatiedot Pronssi-taulukosta Gold Lakehouse -taulukkoon.
Kun edellisen moduulin raakatiedot on ladattu Pronssijärven talo -taulukkoon, voit nyt valmistella nämä tiedot ja täydentää niitä yhdistämällä ne toiseen taulukkoon, joka sisältää alennukset jokaiselle toimittajalle ja heidän matkoilleen tietyn päivän aikana. Tämä viimeinen Gold Lakehouse -taulukko on ladattu ja valmis kulutukseen.
Tietovuon ylätason vaiheet ovat seuraavat:
- Raakatietojen noutaminen Lakehouse-taulukosta, joka on luotu Kopioi-toiminnolla moduulissa 1: Putken luominen Data Factoryavulla .
- Muunna Lakehouse-taulukosta tuodut tiedot.
- Muodosta yhteys CSV-tiedostoon, joka sisältää alennustietoja.
- Muunna alennustiedot.
- Yhdistä matkat ja alennukset -tiedot.
- Lataa tuloskysely Gold Lakehouse -taulukkoon.
Tietojen noutaminen Lakehouse-taulukosta
Valitse sivupalkista työtilasi, valitse Uusi kohde, ja luo sitten uusi tietovuo Gen2 Gen2.
Valitse uudesta tietovuovalikosta Nouda tiedotja sitten Lisää....
Etsi ja valitse Lakehouse -liitin.
Näkyviin tulee Yhdistä tietolähteeseen - -valintaikkuna. Uusi yhteys luodaan automaattisesti puolestasi tällä hetkellä kirjautuneen käyttäjän perusteella. Valitse Seuraava.
Valitse tiedot - -valintaikkuna tulee näkyviin. Etsi siirtymisruudun avulla lakehouse, jonka loit kohdesijainnille aiemmassa moduulissa, ja valitse Tutorial_Lakehouse -tietotaulukko.
(Valinnainen) Kun tiedot on täytetty pohjassa, voit määrittää sarakeprofiilin tietoja, koska tästä on hyötyä tietojen profiloimisessa. Voit ottaa käyttöön oikean muunnoksen ja kohdistaa siihen perustuvat oikeat tietoarvot.
Voit tehdä tämän valitsemalla valintanauhan ruudusta Asetukset ja valitsemalla sitten kolme ensimmäistä vaihtoehtoa kohdasta Sarakeprofiilinja valitsemalla sitten OK.
Lakehousesta tuotujen tietojen muuntaminen
Valitse tietotyyppi-kuvake toisen sarakkeen sarakeotsikosta IpepPickupDatetime, jolloin näkyviin tulee avattava valikko ja valitse tietotyyppi valikosta, jolloin sarake muunnetaan Päivämäärä/aika-Date tyypiksi.
(Valinnainen) - valitse valintanauhanAloitus -välilehdessä Valitse sarakkeet --vaihtoehto Sarakkeiden hallinta ryhmässä.(Valinnainen) - Poista joidenkin tässä lueteltujen sarakkeiden valinta Valitse sarakkeet -valintaikkunassa ja valitse sitten OK.
- lpepDropoffDatetime
- puLocationId
- doLocationId
- nouto leveysaste
- dropoffLongitude
- rateCodeID
Valitse storeAndFwdFlag sarakkeen suodatin- ja lajitteluvalikko. (Jos näet varoituksen, Luettelo on ehkä epätäydellinen, valitse Lataa lisää, jos haluat nähdä kaikki tiedot.)
Valitse Y, jos haluat näyttää vain rivit, joissa alennus on otettu käyttöön, ja valitse sitten OK.
Valitse IpepPickupDatetime sarakkeen lajittelu- ja suodatinvalikko, valitse sitten Päivämääräsuodattimet, ja valitse Välillä...-suodatin, joka annetaan päivämäärä- ja päivämäärä- ja aikatyypeille.
Valitse Suodata rivit -valintaikkunassa päivämäärät väliltä 1.1.2015 ja 31.1.2015 ja valitse sitten OK.
Alennustietoja sisältävään CSV-tiedostoon yhdistäminen
Kun matkojen tiedot ovat valmiina, haluamme ladata tiedot, jotka sisältävät kunkin päivän alennukset ja toimittajatunnuksen, ja valmistella tiedot ennen niiden yhdistämistä matkatietoihin.
Valitse tietovuoeditorin valikon Aloitus -välilehdeltä Nouda tiedot -vaihtoehto ja valitse sitten Text/CSV.
Anna Yhdistä tietolähteeseen -valintaikkunassa seuraavat tiedot:
-
tiedostopolkua tai URL- -
https://raw.githubusercontent.com/ekote/azure-architect/master/Generated-NYC-Taxi-Green-Discounts.csv
- todentamislajin – anonyymi
Valitse sitten Seuraava.
-
tiedostopolkua tai URL- -
Valitse
Esikatselutiedoston tiedot -valintaikkunassa Luo.
Alennustietojen muuntaminen
Kun tarkastelemme tietoja, näemme, että otsikot näyttävät olevan ensimmäisellä rivillä. Ylennä ne otsikoiksi valitsemalla taulukon pikavalikko esikatseluruudukon alueen vasemmasta yläkulmasta ja valitsemalla Käytä ensimmäistä riviä otsikkoina.
Muistiinpano
Ylentämisen jälkeen näet uuden vaiheen lisättynä Käytössä olevat vaiheet -ruutu tietovuoeditorin yläreunassa sarakkeiden tietotyyppeihin.
Napsauta VendorID -saraketta hiiren kakkospainikkeella ja valitse avautuvasta pikavalikosta vaihtoehto, Poista muiden sarakkeiden pivotointi. Näin voit muuntaa sarakkeet määrite–arvo-pareiksi, joissa sarakkeista tulee rivejä.
Kun taulukon pivotointi on purettu, nimeä Attribute- ja Value --sarakkeet uudelleen kaksoisnapsauttamalla niitä ja muuttamalla Attribute muotoon Date ja Value muotoon Discount.
Muuta Päivämäärä-sarakkeen tietotyyppiä valitsemalla tietotyyppivalikko sarakkeen nimen vasemmalta puolelta ja valitsemalla Date.
Valitse
Discount -sarake ja valitse sitten valikosta Muunna --välilehti. Valitse Number -sarake, ja valitse sitten alivalikosta Standard numeeriset muunnokset ja valitse Divide. Kirjoita jaa -valintaikkunan
arvo 100.
Yhdistä matkat ja alennukset -tiedot
Seuraava vaihe on yhdistää molemmat taulukot yhdeksi taulukoksi, jossa on matkalle käytettävä alennus ja mukautettu kokonaissumma.
Vaihda ensin Kaavionäkymä -painike, jotta näet molemmat kyselysi.
Valitse nyc_taxi-kysely ja valitse Home -välilehdestä Yhdistä -valikko ja valitse sitten Yhdistä kyselytja Sitten Yhdistä kyselyt uudeksi.
Valitse Merge -valintaikkunassa Generated-NYC-Taxi-Green-Discounts avattavasta Right -taulukosta merge avattavasta valikosta. Valitse sitten valintaikkunan oikeasta yläkulmasta hehkulamppukuvake, jotta näet ehdotettujen sarakkeiden yhdistämisen näiden kahden taulukon välillä.
Valitse jompi kumpi kahdesta ehdotetusta sarakkeen yhdistämismäärityksestä yksi kerrallaan yhdistäen Toimittajatunnus- ja päivämääräsarakkeet molemmista taulukoista. Kun molemmat yhdistämismääritykset lisätään, vastaavat sarakeotsikot korostetaan kummassakin taulukossa.
Näyttöön tulee viesti, jossa sinua pyydetään sallimaan useiden tietolähteiden tietojen yhdistäminen tulosten tarkastelemiseksi. Valitse OKMerge -valintaikkunassa.
Taulukkoalueella näet aluksi varoituksen, jonka mukaan arviointi peruutettiin, koska useiden lähteiden tietojen yhdistäminen voi paljastaa tietoja yhdestä lähteestä toiseen. Valitse Jatka, jos mahdollisuus tietojen paljastamiseen on ok." Näytä yhdistetyt tiedot valitsemalla Jatka.
Huomaa, miten uusi kysely luotiin kaavionäkymässä. Näet uuden Yhdistä kysely -suhteen kahteen aiemmin luomaasi kyselyyn. Kun tarkastelet editorin taulukkoruutua, vieritä Yhdistä kysely -sarakeluettelon oikealle puolelle, niin näet uuden sarakkeen, jossa on taulukon arvot. Tämä on "Luotu NYC Taxi-Green-Discounts" -sarake, ja sen tyyppi on [Table]. Sarakeotsikossa on kuvake, jonka kaksi nuolta ovat vastakkaiseen suuntaan, joten voit valita sarakkeita taulukosta. Poista kaikkien sarakkeiden valinta paitsi Discount, ja valitse sitten OK.
Kun alennusarvo on nyt rivitasolla, voimme luoda uuden sarakkeen kokonaissumman laskemiseksi alennuksen jälkeen. Valitse Lisää sarake -välilehti editorin yläreunasta ja valitse Mukautettu sarake -General -ryhmästä.
.
Mukautettu sarake -valintaikkunan
voit käyttää Power Query -kaavakieltä (tunnetaan myös nimillä M) määrittämään, miten uusi sarake lasketaan. AnnaTotalAfterDiscount- Uusi sarakenimi , valitse-tietotyypin ja kirjoita seuraava M-lausekeTietotyyppi- Mukautettu sarakekaava - :, jos [totalAmount] > 0, [totalAmount] * ( 1 -[Discount] ) muuten [totalAmount]
Valitse sitten OK.
Valitse juuri luotu TotalAfterDiscount--sarake ja valitse sitten editori-ikkunan yläreunasta Muunna -välilehti. Valitse Numero -sarakkeesta-ryhmästä avattava pyöristys -luettelo ja valitse sitten Round....
Syötä Round -valintaikkunandesimaalien määrälle 2 ja valitse sitten OK.
Muuta ipepPickupDatetime-tietotyyppi päivämäärästä päivämääräksi/ajaksi.
Laajenna lopuksi editorin oikealta puolelta kyselyasetusten ruutu, jos sitä ei ole vielä laajennettu, ja nimeä kysely uudelleen Merge -Output.
Lataa tuloskysely Lakehousessa olevalle taulukolle
Kun tulostekysely on nyt täysin valmis ja tiedot ovat valmiita tulostekäyttöön, voimme määrittää kyselyn tulostekohteen.
Valitse aiemmin luotu Output Merge -kysely. Valitse sitten editorissa Aloitussivun -välilehti ja valitse Lisää tietokohdeKysely -ryhmittelystä ja valitse Lakehouse kohde.
Yhdistä tietokohteeseen -valintaikkunan
yhteys on jo valittuna. Jatka valitsemalla Seuraava. Siirry valitse kohde -valintaikkunan
Lakehouse-kohtaan, johon haluat ladata tiedot, ja anna uudelle taulukolle nimi nyc_taxi_with_discounts . Valitse sitten uudelleenSeuraava .Jätä Valitse kohdeasetukset -valintaikkunan
oletusasetusten Korvaa päivitysmenetelmä. Tarkista, että sarakkeet on yhdistetty oikein, ja valitseTallenna asetukset .Vahvista pääeditorin ikkunassa, että näet tulostekohteen Kyselyasetukset --ruudussa Output -taulukolle, ja valitse sitten Julkaise.
Tärkeä
Kun ensimmäinen tietovuo Gen2 luodaan työtilassa, Lakehouse- ja Warehouse-kohteet valmistellaan yhdessä niihin liittyvien SQL-analytiikan päätepisteiden ja semanttisten mallien kanssa. Nämä kohteet jaetaan työtilan kaikkien tietovoiden kesken, ja niitä tarvitaan, jotta Tietovuo Gen2 toimii, eikä niitä pidä poistaa eivätkä ne ole tarkoitettu käyttäjien käytettäviksi suoraan. Kohteet ovat dataflow Gen2:n toteutustietoja. Kohteet eivät näy työtilassa, mutta ne voivat olla käytettävissä muissa käyttökokemuksissa, kuten Notebook-, SQL-päätepiste-, Lakehouse- ja Warehouse-käyttökokemuksissa. Tunnistat kohteet niiden nimen etuliitteestä. Kohteiden etuliite on "TietovuotStaging".
(Valinnainen) - Työtila-sivulla voit nimetä tietovuon uudelleen valitsemalla kolme pistettä sen tietovuon nimen oikealla puolella, joka tulee näkyviin, kun olet valinnut rivin, ja valitsemalla Ominaisuudet.
Valitse tietovuon päivityskuvake, kun olet valinnut sen rivin, ja kun olet valmis, sinun pitäisi nähdä uusi Lakehouse-taulukkosi, joka on määritetty Data destination -asetuksissa.
Tarkista Lakehousesta uusi sinne ladattu taulukko.
Aiheeseen liittyvä sisältö
Tässä toisessa moduulissa, joka opasti päästä päähän -opetusohjelmaan tietojen integroinnista Data Factoryn avulla Microsoft Fabricissa, opit
- Luo uusi tietovuo Gen2.
- Tuomaan ja muuntamaan mallitietoja.
- Tuo ja muunna teksti- tai CSV-tietoja.
- Yhdistä kummankin tietolähteen tiedot uudeksi kyselyksi.
- Muunna tietoja ja luo kyselyssä uusia sarakkeita.
- Määritä kyselyn tulosteen kohdelähde.
- Nimeä uusi tietovuo uudelleen ja päivitä se.
Jatka seuraavaan osioon nyt integroidaksesi tietoputken.