Jaa


Hinnoitteluskenaario, jossa Tietovuo Gen2 lataa 2 Gigatavua Parquet-tietoja Lakehouse-taulukkoon

Tässä skenaariossa Dataflow Gen2:n avulla ladattiin 2 gigatavua Azure Data Lake Tallennus (ADLS) Gen2:een tallennettuja Parquet-tietoja Microsoft Fabricin Lakehouse-taulukkoon. Käytimme New Yorkin kaupungin taksinvihreän mallidataa Parquet-tiedoille.

Seuraavassa esimerkissä käytetyt hinnat ovat oletellisia, eikä niitä ole tarkoitus tarkoittaa täsmälleen todellisella hinnoittelulla. Niiden tarkoituksena on vain osoittaa, miten voit arvioida, suunnitella ja hallita Microsoft Fabricin Data Factory -projektien kustannuksia. Koska Fabric-kapasiteetit hinnoitellaan ainutlaatuisesti eri alueilla, käytämme Fabric-kapasiteetin käytön mukaan laskutettua hinnoittelua Us West 2:ssa (tyypillinen Azure-alue) hintaan 0,18 dollaria CU:ta kohti tunnissa. Katso täältä Microsoft Fabric – Hinnoittelu ja tutustu muihin Fabric-kapasiteetin hinnoitteluvaihtoehtoihin.

Määritys

Tämän skenaarion saavuttamiseksi sinun on luotava tietovuo seuraavien vaiheiden avulla:

  1. Alusta tietovuo: Hae 2 Gt:n parquet-tiedostojen tiedot ADLS Gen2 -tallennustililtä.
  2. Määritä Power Query:
    1. Siirry Power Queryen.
    2. Varmista, että kyselyn valmisteluasetus on käytössä.
    3. Jatka parquet-tiedostojen yhdistämista.
  3. Tietomuunnos:
    1. Ylennä otsikot selkeyden vuoksi.
    2. Poista tarpeettomat sarakkeet.
    3. Säädä tarvittaessa sarakkeen tietotyyppejä.
  4. Määritä tulostetietokohde:
    1. Määritä Lakehouse tietojen tuloskohteeksi.
    2. Tässä esimerkissä luotiin ja hyödynnettiin Fabric-pohjainen Lakehouse-talo.

Kustannusarvio Fabric Metrics -sovelluksen avulla

Screenshot showing the duration and CU consumption of the job in the Fabric Metrics App.

Screenshot showing details of Dataflow Gen2 Refresh duration and CU consumption.

Screenshot showing details of SQL Endpoint Query duration and CU consumption used in the run.

Screenshot showing details of Warehouse Query and OneLake Compute duration and CU consumption used in the run.

Screenshot showing details of Query and Dataset On-Demand Refresh duration and CU consumption and SQL Endpoint Query used in the run.

Screenshot showing details of a second Query and Dataset On-Demand Refresh duration and CU consumption used in the run.

Screenshot showing details of OneLake Compute and 2 High Scale Dataflow Compute duration and CU consumption used in the run.

Suuren skaalauksen tietovuon käsittelymittari kirjasi vähäistä toimintaa. Tietovuon Gen2-päivitystoimintojen vakio käsittelymittari kuluttaa 112 098,540 käsittelyyksikköä (CUS). On tärkeää huomioida, että muut toiminnot, kuten Warehouse Query, SQL Endpoint Query ja Tietojoukon pyydettäessä suoritettava päivitys, muodostavat tietovuon Gen2-toteutuksen yksityiskohtaiset osa-alueet, jotka ovat tällä hetkellä avoimia ja välttämättömiä omissa toiminnoissaan. Nämä toiminnot salataan kuitenkin tulevissa päivityksissä, ja ne on jätettävä huomiotta arvioitaessa Dataflow Gen2:n kustannuksia.

Muistiinpano

Vaikka suorituksen todellinen kesto raportoidaan mittarina, sillä sen todellinen kesto ei ole merkityksellinen laskettaessa voimassa olevia CU-tunteja Fabric Metrics -sovelluksella, koska CU-sekuntien mittarin avulla se myös ilmoittaa jo sen keston.

Metric Vakio käsittely Suuren skaalautuvan käsittelyn
CU-sekunteja yhteensä 112 098,54 CU sekuntia 0 CU sekuntia
Voimassa olevan CU-tuntien laskutus 112,098.54 / (60*60) = 31.14 CU tuntia 0 / (60*60) = 0 CU tuntia

Kokonaiskulutus 0,18 $ / CU tunti = (31,14 CU-tuntia) * (0,18 $ / CU tunti) ~= $5,60