Compartir vía


Tutorial: Ingesta de datos en un almacén

Esto se aplica a:✅ Warehouse en Microsoft Fabric

En este tutorial, aprenderá a ingerir datos de Microsoft Azure Storage en un almacén para crear tablas.

Nota

Este tutorial forma parte de un escenario de un extremo a otro. Para completar este tutorial, primero debe completar estos tutoriales:

  1. Crear un área de trabajo
  2. Crear un almacén

Ingerir datos

En esta tarea, aprenderá a ingerir datos en el almacenamiento para crear tablas.

  1. Asegúrese de que el área de trabajo que creó en el primer tutorial esté abierta.

  2. En el panel de aterrizaje del área de trabajo, seleccione + Nuevo elemento para mostrar la lista completa de tipos de elementos disponibles.

  3. En la lista, en la sección Obtener datos, seleccione el tipo de elemento Canalización de datos.

  4. En la ventana Nueva canalización, en el cuadro Nombre, escriba Load Customer Data.

    Recorte de pantalla del cuadro de diálogo Nueva canalización, en el que se resalta el nombre especificado.

  5. Para aprovisionar la canalización, seleccione Crear. El aprovisionamiento se completa cuando aparece la página de aterrizaje Crear una canalización de datos.

  6. En la página de aterrizaje de la canalización de datos, seleccione Actividad de canalización.

    Recorte de pantalla de la página de aterrizaje Crear una canalización de datos, en el que se resalta la opción Actividad de canalización.

  7. En el menú, en la sección Mover y transformar, seleccione Copiar datos.

    Captura de pantalla de la sección Mover y transformar, en la que se muestra dónde seleccionar Copiar datos.

  8. En el lienzo de diseño de canalización, seleccione la actividad Copiar datos.

    Recorte de pantalla de los datos de copia ubicados en el lienzo de diseño.

  9. Para configurar la actividad, en la página General, en el cuadro Nombre, reemplace el texto predeterminado por CD Load dimension_customer.

    Captura de pantalla de la pestaña General, en la que se muestra dónde escribir el nombre de la actividad de copia.

  10. En la página Origen, en la lista desplegable de Conexión, seleccione Más para mostrar todos los orígenes de datos entre los que puede elegir, incluidos los orígenes de datos del catálogo de OneLake.

  11. Seleccione + Nuevo para crear un nuevo origen de datos.

  12. Busque y, a continuación, seleccione Blobs de Azure.

  13. En la página Conectar origen de datos, en el cuadro Nombre de cuenta o dirección URL, escriba https://fabrictutorialdata.blob.core.windows.net/sampledata/.

  14. Tenga en cuenta que la lista desplegable Nombre de conexión se rellena automáticamente y que el tipo de autenticación se establece en Anónimo.

    Captura de pantalla de la ventana Conectar al origen de datos que muestra toda la configuración realizada.

  15. Seleccione Conectar.

  16. En la página Origen, para acceder a los archivos Parquet del origen de datos, complete la configuración siguiente:

    1. En los cuadros Ruta de acceso del archivo, escriba:

      1. Ruta de acceso del archivo : contenedor:sampledata

      2. Ruta de acceso del archivo - Directorio:WideWorldImportersDW/tables

      3. Ruta de acceso del archivo - Nombre de archivo:dimension_customer.parquet

    2. En la lista desplegable Formato de archivo, seleccione Parquet.

  17. Para obtener una vista previa de los datos y probar que no hay errores, seleccione Vista previa de los datos.

    Captura de pantalla de la página Origen, resaltando los cambios realizados en los pasos anteriores y la función Vista previa de datos.

  18. En la página Destino, en la lista desplegable Conexión, seleccione el almacén de Wide World Importers.

  19. Para la opción Tabla, seleccione Crear tabla automáticamente.

  20. En el primer cuadro Tabla, escriba dbo.

  21. En el segundo cuadro, escriba dimension_customer.

    Captura de pantalla de la página Destino, en la que se resaltan los cambios realizados en los pasos anteriores.

  22. En la cinta de opciones Inicio, seleccione Ejecutar.

  23. En el cuadro de diálogo ¿Guardar y ejecutar?, seleccione Guardar y ejecutar para que la canalización cargue la tabla dimension_customer.

    Captura de pantalla del cuadro de diálogo Guardar y ejecutar, resaltando el botón Guardar y ejecutar.

  24. Para supervisar el progreso de la actividad de copia, revise las actividades de ejecución de la canalización en la página Salida (espere a que se complete y que tenga el estado Correcto).

    Captura de pantalla de la página de resultados, resaltando el estado Con éxito.

Paso siguiente