Del via


Prisfastsættelsesscenarie ved hjælp af Dataflow Gen2 til at indlæse 2 GB CSV-data i det lokale miljø i en Lakehouse-tabel

I dette scenarie blev Dataflow Gen2 brugt til at indlæse 2 GB CSV-data i det lokale miljø i en Lakehouse-tabel i Microsoft Fabric.

De priser, der bruges i følgende eksempel, er hypotetiske og har ikke til hensigt at indebære nøjagtige faktiske priser. Disse er blot for at vise, hvordan du kan estimere, planlægge og administrere omkostninger for Data Factory-projekter i Microsoft Fabric. Da Fabric-kapaciteter prissættes entydigt på tværs af områder, bruger vi også prissætningen efter forbrug for en Fabric-kapacitet i det vestlige USA 2 (et typisk Azure-område) til 0,18 USD pr. CU pr. time. Se Microsoft Fabric – Priser for at udforske andre muligheder for prisfastsættelse for Fabric-kapacitet her.

Konfiguration

Hvis du vil opnå dette scenarie, skal du oprette et dataflow ved hjælp af følgende trin:

  1. Initialiser dataflow: Start med at uploade 2 GB CSV-filer fra dit lokale miljø til dataflowet.
  2. Konfigurer Power-forespørgsel:
    1. Gå til Power Query.
    2. Deaktiver indstillingen for midlertidig lagring af forespørgslen.
    3. Fortsæt med at kombinere CSV-filerne.
  3. Datatransformation:
    1. Hæv overskrifter for at skabe klarhed.
    2. Fjern unødvendige kolonner.
    3. Juster kolonnedatatyper efter behov.
  4. Definer destination for outputdata:
    1. Konfigurer Lakehouse som destination for dataoutput.
    2. I dette eksempel blev der oprettet og brugt et Lakehouse i Fabric.

Estimering af omkostninger ved hjælp af Appen Fabric Metrics

Skærmbillede, der viser varigheden og forbruget af CU for jobbet i appen Fabric Metrics.

Skærmbillede, der viser detaljer om omkostningen for Gen2-opdatering af dataflow.

Skærmbillede, der viser detaljer om et Dataflow Gen2 High Scale Dataflow Compute-forbrug, der bruges i kørslen.

Skærmbillede, der viser detaljer om et andet Dataflow Gen2 High Scale Dataflow Compute-forbrug, der bruges i kørslen.

Handlingen Gen2-opdatering af dataflow forbrugte 4749,42 CU sekunder, og to handlinger for beregning af dataflow i høj skala brugte 7,78 CU sekunder + 7,85 CU sekunder hver.

Bemærk

Selvom den er rapporteret som en metrikværdi, er den faktiske varighed af kørslen ikke relevant ved beregning af de effektive CU-timer med Fabric Metrics-appen, da den metrikværdi for CU-sekunder, den også rapporterer, allerede tegner sig for dens varighed.

Metric Beregningsforbrug
Opdatering af CU-sekunder for dataflow gen2 4749,42 CU sekunder
Beregnings-CU-sekunder for dataflow i høj skala (7,78 + 7,85) 15,63 CU sekunder
Fakturerede effektive CU-timer (4749.42 + 15.63) / (60*60) = 1,32 CU timer

Samlede kørselsomkostninger pr. $0.18/CU time = (1,32 CU-timer) * ($0,18/CU time) ~= $0,24