Compartir a través de


Copia de Azure Blob Storage a Lakehouse

En este tutorial, crea una canalización de datos para mover un archivo CSV desde una carpeta de entrada de un origen de Azure Blob Storage a un destino de Lakehouse.

Requisitos previos

Para empezar, debe completar los siguientes requisitos previos:

  • Asegúrese de que tiene un área de trabajo habilitada para el proyecto de Microsoft Fabric: Crear un área de trabajo.

  • Seleccione el botón Probarlo ahora para preparar el origen de datos de Azure Blob Storage de la copia. Cree un nuevo grupo de recursos para esta instancia de Azure Blob Storage y seleccione Revisar y crear>Crear.

    Captura de pantalla de la pantalla Detalles del proyecto.

    A continuación, se crea una instancia de Azure Blob Storage y moviesDB2.csv se carga en la carpeta de entrada de la instancia de Azure Blob Storage creada.

    Captura de pantalla que muestra dónde aparece el nuevo almacenamiento en la carpeta.

Crear una canalización de datos

  1. Cambie a Factoría de datos en la página de app.powerbi.com.

  2. Cree una nueva área de trabajo para esta demostración.

    Captura de pantalla de la pantalla Área de trabajo.

  3. Seleccione Nueva y, a continuación, seleccione Canalización de datos.

    Captura de pantalla del menú Nueva.

Copia de datos mediante el Asistente de copia

En esta sesión, comienza a compilar una canalización de datos mediante los pasos siguientes. Estos pasos copian un archivo CSV de una carpeta de entrada de una instancia de Azure Blob Storage en un destino de Lakehouse mediante el asistente de copia.

Paso 1: Empezar con el asistente de copia

  1. Seleccione el asistente para copiar datos en el lienzo para abrir la herramienta Asistente de copia para empezar. O bien, seleccione Usar asistente de copia en la lista desplegable Copiar datos en la pestaña Actividades de la cinta de opciones.

    Captura de pantalla de las dos opciones para seleccionar el asistente de copia.

Paso 2: Configurar el origen

  1. Escriba blob en el filtro de selección y, a continuación, seleccione Blobs de Azure y Siguiente.

    Captura de pantalla que muestra dónde elegir Azure Blob Storage como origen de datos.

  2. Proporcione el nombre de la cuenta o la dirección URL y cree una conexión al origen de datos seleccionando Crear nueva conexión en la lista desplegable Conexión.

    Captura de pantalla que muestra dónde seleccionar Nueva conexión.

    1. Después de seleccionar Crear nueva conexión con su cuenta de almacenamiento especificada, solo tiene que rellenar el Tipo de autenticación. En esta demostración, elegiremos Clave de cuenta, pero puede elegir otro tipo de autenticación según su preferencia.

      Captura de pantalla que muestra la pantalla Conectarse al origen de datos del asistente de copia de datos.

    2. Una vez que la conexión se haya creado correctamente, solo tiene que seleccionar Siguiente para conectarse al origen de datos.

  3. Elija el archivo moviesDB2.csv en la configuración de origen para obtener una vista previa y, a continuación, seleccione Siguiente.

    Captura de pantalla que muestra cómo elegir el origen de datos.

Paso 3: Configurar el destino

  1. Seleccionar Lakehouse.

    Captura de pantalla que muestra el cuadro de diálogo Elegir destino de datos con Lakehouse seleccionado.

  2. Proporcione un nombre para el nuevo almacén de lago. Luego, seleccione Crear y Conectar.

    Captura de pantalla que muestra el cuadro de diálogo Elegir destino de datos con la opción Nueva instancia de Lakehouse seleccionada.

  3. Configure y asigne los datos de origen al destino; a continuación, seleccione Siguiente para finalizar las configuraciones de destino.

    Captura de pantalla que muestra el cuadro de diálogo Conectarse al destino de datos en el asistente de copia de datos con el nombre de tabla MoviesDB completado.

Paso 4: Revisar y crear la actividad de copia

  1. Revise la configuración de la actividad de copia en los pasos anteriores y seleccione Guardar + ejecutar para finalizar. O bien, puede volver a los pasos anteriores para editar la configuración en la herramienta, si fuera necesario.

    Captura de pantalla que muestra la pantalla Revisar y crear en el cuadro de diálogo Asistente de copia de datos.

  2. Una vez finalizada, la actividad de copia se agrega al lienzo de la canalización de datos y se ejecuta directamente si deja activada la casilla Iniciar transferencia de datos inmediatamente.

    Captura de pantalla que muestra la actividad de copia finalizada.

Ejecución y programación de la canalización de datos

  1. Si no abandonó la casilla Iniciar transferencia de datos inmediatamente en la página Revisar + crear, cambie a la pestaña Inicio y seleccione Ejecutar. A continuación, seleccione Guardar y ejecutar.

    Captura de pantalla que muestra el botón Ejecución de actividad de copia en la pestaña Inicio.

    Captura de pantalla que muestra el cuadro de diálogo Guardar y ejecutar para la actividad de copia.

  2. En la pestaña Salida, seleccione el vínculo con el nombre de la actividad de copia para supervisar el progreso y comprobar los resultados de la ejecución.

    Captura de pantalla que muestra el botón Detalles de la ejecución.

  3. El cuadro de diálogo Detalles de la copia de datos muestra los resultados de la ejecución, incluido el estado, el volumen de datos leídos y escritos, las horas de inicio y detención, y la duración.

    Captura de pantalla que muestra el cuadro de diálogo Copiar datos.

  4. También puede programar la canalización para que se ejecute con una frecuencia específica según sea necesario. En el ejemplo siguiente se muestra cómo programar la canalización para que se ejecute cada 15 minutos.

    Captura de pantalla que muestra el cuadro de diálogo de la configuración de la programación.

    Captura de pantalla que muestra una canalización con una programación configurada para ejecutarse cada 15 minutos.

La canalización de este ejemplo muestra cómo copiar datos de Azure Blob Storage a Lakehouse. Ha aprendido a:

  • Crear una canalización de datos.
  • Copiar datos con el asistente de copia.
  • Ejecutar y programar la canalización de datos.

A continuación, avance para obtener más información sobre la supervisión de las ejecuciones de canalización.