Cenário de preços usando o Dataflow Gen2 para carregar 2 GB de dados CSV locais em uma tabela do lakehouse
Nesse cenário, o Dataflow Gen2 foi usado para carregar 2 GB de dados CSV locais em uma tabela do lakehouse no Microsoft Fabric.
Os preços usados no exemplo a seguir são hipotéticos e não pretendem sugerir o preço real exato. Eles apenas demonstram como você pode estimar, planejar e gerenciar custos para projetos do Data Factory no Microsoft Fabric. Além disso, como as capacidades do Fabric são precificadas exclusivamente entre regiões, usamos o preço pago conforme o uso para uma capacidade do Fabric no Oeste dos EUA 2 (uma região típica do Azure), a US$ 0,18 por CU por hora. Consulte aqui os Preços do Microsoft Fabric para explorar outras opções de preços de capacidades do Fabric.
Configuração
Para realizar esse cenário, você precisa criar um fluxo de dados com as seguintes etapas:
- Inicializar o fluxo de dados: comece carregando arquivos CSV de 2 GB do seu ambiente local no fluxo de dados.
- Configurar o Power Query:
- Navegue até o Power Query.
- Desabilite a opção de preparo da consulta.
- Prossiga para combinar os arquivos CSV.
- Transformação de dados:
- Destaque cabeçalhos para maior clareza.
- Remova colunas desnecessárias.
- Ajuste os tipos de dados das colunas conforme necessário.
- Defina o destino dos dados de saída:
- Configure o Lakehouse como o destino de saída dos dados.
- Neste exemplo, um Lakehouse dentro do Fabric foi criado e utilizado.
Estimativa de custo usando o Aplicativo de Métricas do Fabric
A operação de atualização do Dataflow Gen2 consumiu 4.749,42 segundos de CU e duas operações de computação de fluxos de dados em alta escala consumiram 7,78 segundos de CU + 7,85 segundos de CU cada.
Observação
Embora relatado como uma métrica, a duração real da execução não é relevante ao calcular as horas efetivas de CU com o Aplicativo de Métricas do Fabric, uma vez que a métrica de segundos de CU que ele também relata já conta para sua duração.
Metric | Consumo de computação |
---|---|
Segundos de CU para atualização do Dataflow Gen2 | 4.749,42 segundos de CU |
Segundos de CU de computação de fluxos de dados em alta escala | (7,78 + 7,85) 15,63 segundos de CU |
Horas de CU efetivas cobradas | (4.749,42 + 15,63) / (60*60) = 1,32 horas de CU |
Custo total da execução a US$ 0,18/hora de CU = (1,32 horas de CU) * (US$ 0,18/hora de CU) ~= US$ 0,24