Dela via


Prisscenario med Dataflow Gen2 för att läsa in 2 GB lokala CSV-data till en Lakehouse-tabell

I det här scenariot användes Dataflow Gen2 för att läsa in 2 GB lokala CSV-data till en Lakehouse-tabell i Microsoft Fabric.

Priserna som används i följande exempel är hypotetiska och avser inte att innebära exakta faktiska priser. Dessa är bara för att visa hur du kan beräkna, planera och hantera kostnader för Data Factory-projekt i Microsoft Fabric. Eftersom Infrastrukturkapaciteter är unikt prissatta mellan regioner använder vi prissättningen betala per användning för en Infrastrukturkapacitet i USA, västra 2 (en typisk Azure-region) till 0,18 USD per CU per timme. Se Microsoft Fabric – Priser för att utforska andra prisalternativ för Infrastrukturkapacitet.

Konfiguration

För att åstadkomma det här scenariot måste du skapa ett dataflöde med följande steg:

  1. Initiera Dataflöde: Börja med att ladda upp 2 GB CSV-filer från din lokala miljö till dataflödet.
  2. Konfigurera Power Query:
    1. Gå till Power Query.
    2. Inaktivera alternativet för att mellanlagring av frågan.
    3. Fortsätt att kombinera CSV-filerna.
  3. Datatransformering:
    1. Höj upp rubriker för tydlighetens skull.
    2. Ta bort onödiga kolumner.
    3. Justera kolumndatatyper efter behov.
  4. Definiera utdatamål:
    1. Konfigurera Lakehouse som datautdatamål.
    2. I det här exemplet skapades och användes ett Lakehouse i Fabric.

Kostnadsuppskattning med hjälp av fabric Metrics-appen

Skärmbild som visar varaktigheten och CU-förbrukningen för jobbet i Fabric Metrics-appen.

Skärmbild som visar information om kostnaden för Dataflow Gen2-uppdatering.

Skärmbild som visar information om en Dataflow Gen2 High Scale Dataflow Compute-förbrukning som används i körningen.

Skärmbild som visar information om en andra Dataflow Gen2 High Scale Dataflow Compute-förbrukning som används i körningen.

Åtgärden Dataflow Gen2 Refresh förbrukade 4749,42 CU-sekunder och två beräkningsåtgärder för dataflöden i hög skala förbrukade 7,78 CU-sekunder + 7,85 CU-sekunder vardera.

Kommentar

Även om den rapporteras som ett mått är den faktiska varaktigheten för körningen inte relevant när du beräknar de effektiva CU-timmarna med Fabric Metrics-appen eftersom CU-sekundersmåttet som det också rapporterar redan står för dess varaktighet.

Mått Beräkningsförbrukning
Dataflöde Gen2 Uppdatera CU-sekunder 4749,42 CU sekunder
Cu-sekunder för beräkning av dataflöden i hög skala (7,78 + 7,85) 15,63 CU sekunder
Effektiva CU-timmar faktureras (4749,42 + 15,63) / (60*60) = 1,32 CU timmar

Total körningskostnad på $0.18/CU timme = (1.32 CU-timmar) * ($0.18/CU timme) ~= $0.24