Compartilhar via


Cenário de preços usando o Dataflow Gen2 para carregar 2 GB de dados CSV locais em uma tabela do lakehouse

Nesse cenário, o Dataflow Gen2 foi usado para carregar 2 GB de dados CSV locais em uma tabela do lakehouse no Microsoft Fabric.

Os preços usados no exemplo a seguir são hipotéticos e não pretendem sugerir o preço real exato. Eles apenas demonstram como você pode estimar, planejar e gerenciar custos para projetos do Data Factory no Microsoft Fabric. Além disso, como as capacidades do Fabric são precificadas exclusivamente entre regiões, usamos o preço pago conforme o uso para uma capacidade do Fabric no Oeste dos EUA 2 (uma região típica do Azure), a US$ 0,18 por CU por hora. Consulte aqui os Preços do Microsoft Fabric para explorar outras opções de preços de capacidades do Fabric.

Configuração

Para realizar esse cenário, você precisa criar um fluxo de dados com as seguintes etapas:

  1. Inicializar o fluxo de dados: comece carregando arquivos CSV de 2 GB do seu ambiente local no fluxo de dados.
  2. Configurar o Power Query:
    1. Navegue até o Power Query.
    2. Desabilite a opção de preparo da consulta.
    3. Prossiga para combinar os arquivos CSV.
  3. Transformação de dados:
    1. Destaque cabeçalhos para maior clareza.
    2. Remova colunas desnecessárias.
    3. Ajuste os tipos de dados das colunas conforme necessário.
  4. Defina o destino dos dados de saída:
    1. Configure o Lakehouse como o destino de saída dos dados.
    2. Neste exemplo, um Lakehouse dentro do Fabric foi criado e utilizado.

Estimativa de custo usando o Aplicativo de Métricas do Fabric

Captura de tela mostrando a duração e o consumo de do trabalho no Aplicativo de Métricas do Fabric.

Captura de tela mostrando detalhes do custo de Atualização do Fluxo de Dados Gen2.

Captura de tela mostrando detalhes de um consumo de computação de fluxo de dados de alta escala do Fluxo de Dados Gen2 usado na execução.

Captura de tela mostrando detalhes de um segundo consumo de computação de fluxo de dados de alta escala do Fluxo de Dados Gen2 usado na execução.

A operação de atualização do Dataflow Gen2 consumiu 4.749,42 segundos de CU e duas operações de computação de fluxos de dados em alta escala consumiram 7,78 segundos de CU + 7,85 segundos de CU cada.

Observação

Embora relatado como uma métrica, a duração real da execução não é relevante ao calcular as horas efetivas de CU com o Aplicativo de Métricas do Fabric, uma vez que a métrica de segundos de CU que ele também relata já conta para sua duração.

Metric Consumo de computação
Segundos de CU para atualização do Dataflow Gen2 4.749,42 segundos de CU
Segundos de CU de computação de fluxos de dados em alta escala (7,78 + 7,85) 15,63 segundos de CU
Horas de CU efetivas cobradas (4.749,42 + 15,63) / (60*60) = 1,32 horas de CU

Custo total da execução a US$ 0,18/hora de CU = (1,32 horas de CU) * (US$ 0,18/hora de CU) ~= US$ 0,24