Hinnoitteluskenaario, jossa Tietovuo Gen2 lataa 2 Gigatavua Parquet-tietoja Lakehouse-taulukkoon
Tässä skenaariossa Dataflow Gen2:n avulla ladattiin 2 gigatavua Azure Data Lake Tallennus (ADLS) Gen2:een tallennettuja Parquet-tietoja Microsoft Fabricin Lakehouse-taulukkoon. Käytimme New Yorkin kaupungin taksinvihreän mallidataa Parquet-tiedoille.
Seuraavassa esimerkissä käytetyt hinnat ovat oletellisia, eikä niitä ole tarkoitus tarkoittaa täsmälleen todellisella hinnoittelulla. Niiden tarkoituksena on vain osoittaa, miten voit arvioida, suunnitella ja hallita Microsoft Fabricin Data Factory -projektien kustannuksia. Koska Fabric-kapasiteetit hinnoitellaan ainutlaatuisesti eri alueilla, käytämme Fabric-kapasiteetin käytön mukaan laskutettua hinnoittelua Us West 2:ssa (tyypillinen Azure-alue) hintaan 0,18 dollaria CU:ta kohti tunnissa. Katso täältä Microsoft Fabric – Hinnoittelu ja tutustu muihin Fabric-kapasiteetin hinnoitteluvaihtoehtoihin.
Määritys
Tämän skenaarion saavuttamiseksi sinun on luotava tietovuo seuraavien vaiheiden avulla:
- Alusta tietovuo: Hae 2 Gt:n parquet-tiedostojen tiedot ADLS Gen2 -tallennustililtä.
- Määritä Power Query:
- Siirry Power Queryen.
- Varmista, että kyselyn valmisteluasetus on käytössä.
- Jatka parquet-tiedostojen yhdistämista.
- Tietomuunnos:
- Ylennä otsikot selkeyden vuoksi.
- Poista tarpeettomat sarakkeet.
- Säädä tarvittaessa sarakkeen tietotyyppejä.
- Määritä tulostetietokohde:
- Määritä Lakehouse tietojen tuloskohteeksi.
- Tässä esimerkissä luotiin ja hyödynnettiin Fabric-pohjainen Lakehouse-talo.
Kustannusarvio Fabric Metrics -sovelluksen avulla
Suuren skaalauksen tietovuon käsittelymittari kirjasi vähäistä toimintaa. Tietovuon Gen2-päivitystoimintojen vakio käsittelymittari kuluttaa 112 098,540 käsittelyyksikköä (CUS). On tärkeää huomioida, että muut toiminnot, kuten Warehouse Query, SQL Endpoint Query ja Tietojoukon pyydettäessä suoritettava päivitys, muodostavat tietovuon Gen2-toteutuksen yksityiskohtaiset osa-alueet, jotka ovat tällä hetkellä avoimia ja välttämättömiä omissa toiminnoissaan. Nämä toiminnot salataan kuitenkin tulevissa päivityksissä, ja ne on jätettävä huomiotta arvioitaessa Dataflow Gen2:n kustannuksia.
Muistiinpano
Vaikka suorituksen todellinen kesto raportoidaan mittarina, sillä sen todellinen kesto ei ole merkityksellinen laskettaessa voimassa olevia CU-tunteja Fabric Metrics -sovelluksella, koska CU-sekuntien mittarin avulla se myös ilmoittaa jo sen keston.
Metric | Vakio käsittely | Suuren skaalautuvan käsittelyn |
---|---|---|
CU-sekunteja yhteensä | 112 098,54 CU sekuntia | 0 CU sekuntia |
Voimassa olevan CU-tuntien laskutus | 112,098.54 / (60*60) = 31.14 CU tuntia | 0 / (60*60) = 0 CU tuntia |
Kokonaiskulutus 0,18 $ / CU tunti = (31,14 CU-tuntia) * (0,18 $ / CU tunti) ~= $5,60