Compartir a través de


Escenario de precios mediante Flujo de datos Gen2 para cargar 2 GB de datos CSV locales en una tabla de Lakehouse

En este escenario, se usó Flujo de datos Gen2 para cargar 2 GB de datos CSV locales en una tabla de Lakehouse en Microsoft Fabric.

Los precios utilizados en el siguiente ejemplo son hipotéticos y no pretenden reflejar precios reales exactos. Estos son solo para demostrar cómo puede calcular, planear y administrar el costo de los proyectos de Data Factory en Microsoft Fabric. Además, dado que las capacidades de Fabric tienen un precio único en cada región, usamos los precios de pago por uso para una capacidad de Fabric en Oeste de EE. UU. 2 (una región típica de Azure), a 0,18 USD por CU por hora. Consulte la página de precios de Microsoft Fabric para explorar otras opciones de precios de capacidad de Fabric.

Configuración

Para lograr este escenario, es preciso crear un flujo de datos con los siguientes pasos:

  1. Inicialización del flujo de datos: para empezar, cargue archivos CSV de 2 GB desde el entorno local en el flujo de datos.
  2. Configuración de Power Query:
    1. Vaya a Power Query.
    2. Deshabilite la opción para almacenar provisionalmente la consulta.
    3. Continúe para combinar los archivos CSV.
  3. Transformación de datos:
    1. Promueva encabezados para mayor claridad.
    2. Quite las columnas innecesarias.
    3. Ajuste los tipos de datos de columna según sea necesario.
  4. Definición del destino de los datos de salida:
    1. Configure Lakehouse como destino de salida de datos.
    2. En este ejemplo, se creó y utilizó una instancia de Lakehouse en Fabric.

Estimación de costos mediante la aplicación Métricas de Fabric

Captura de pantalla que muestra la duración y el consumo de CU del trabajo en la aplicación De métricas de Fabric.

Captura de pantalla que muestra los detalles del costo de actualización de Dataflow Gen2.

Captura de pantalla en la que se muestran los detalles de un consumo de proceso de flujo de datos de gran escala de Dataflow Gen2 que se usa en la ejecución.

Captura de pantalla que muestra los detalles de un segundo consumo de proceso de flujo de datos de gran escala de Dataflow Gen2 que se usa en la ejecución.

La operación de actualización de Flujo de datos Gen2 consumió 4749,42 segundos de CU, y dos operaciones de proceso de flujos de datos a gran escala consumieron 7,78 segundos de CU + 7,85 segundos de CU cada una.

Nota:

Aunque se notifica como métrica, la duración real de la ejecución no es pertinente al calcular las horas de CU efectivas con la aplicación Métricas de Fabric, ya que la métrica de segundos de CU que también notifica ya tiene en cuenta su duración.

Metric Consumo de procesos
Segundos de CU de actualización de Flujo de datos Gen2 4749,42 segundos de CU
Segundos de CU de proceso de flujos de datos a gran escala (7,78 + 7,85) 15,63 segundos de CU
Horas efectivas de CU facturadas (4749,42 + 15,63) / (60*60) = 1,32 horas de CU

Costo total de ejecución a 0,18 USD/hora de CU = (1,32 horas de CU) * (0,18 USD/hora de CU) ~= 0,24 USD