Módulo 1: Crear una canalización con Data Factory
Este módulo tarda 10 minutos en ingerir datos sin procesar del almacén de origen en la tabla Bronze de un data Lakehouse mediante el actividad de copia de una canalización.
Los pasos de alto nivel en el módulo 1 son los siguientes:
- Cree el canal de datos.
- Use una actividad de copia en la canalización para cargar datos de ejemplo en una instancia de Data Lakehouse.
Crear un canal de datos
Se requiere una cuenta de inquilino de Microsoft Fabric con una suscripción activa. Crear una cuenta gratuita.
Asegúrese de que tiene un área de trabajo habilitada para Microsoft Fabric: Crear un área de trabajo.
Inicie sesión en Power BI.
Seleccione el icono predeterminado de Power BI en la parte inferior izquierda de la pantalla y cambie a la experiencia de Data Factory.
Seleccione Conducto de datos y proporcione un nombre de conducto. Seleccione Crear.
Uso de un actividad de copia en la canalización para cargar datos de ejemplo en una instancia de Data Lakehouse
Paso 1: Usar el asistente de copia para agregar una actividad de copia
Seleccione Copiar datos para abrir la herramienta copiar asistente.
Paso 2: Configurar las opciones en el asistente de copia.
El cuadro de diálogo Copiar datos se muestra con el primer paso, Elegir origen de datos , resaltado. Desplácese hacia abajo si es necesario hasta la sección Orígenes de datos y seleccione el tipo de origen de datos Azure Blob Storage. Seleccione Siguiente.
En el siguiente paso, seleccione Crear nueva conexión y, a continuación, proporcione la URL del almacenamiento blob que aloja los datos de ejemplo proporcionados para este aprendizaje, en
https://nyctaxisample.blob.core.windows.net/sample
. El tipo de autenticación es Anónimo. Seleccione Siguiente después de proporcionar la dirección URL.Aparece el paso Conectar al origen de datos e, inicialmente, aparece un error No se pueden enumerar los archivos, porque los permisos solo se han concedido a la carpeta muestra en el almacenamiento de blobs. Indique el nombre de la carpeta, muestra, y seleccione Reintentar.
Nota:
La carpeta blob Storage distingue mayúsculas de minúsculas y debe estar en minúsculas.
El explorador de Blob Storage aparece a continuación. Seleccione el archivo NYC-Taxi-Green-2015-01.parquet y espere a que aparezca la vista previa de datos. Seleccione Siguiente.
Para el paso Elegir destino de datos del asistente de copia, seleccione Lakehouse y, a continuación, Siguiente.
Seleccione Crear nuevo Lakehouse en la página de configuración de destino de datos que aparece e introduzca un nombre para el nuevo Lakehouse. A continuación, seleccione Siguiente de nuevo.
Ahora configure los detalles de su destino de Lakehouse en la página Seleccionar y asignar a la ruta de la carpeta o tabla. Seleccione Tablas para la carpeta raíz , proporcione un nombre de tabla y elija la acción Sobrescribir. No marque la casilla de verificación Habilitar partición que aparece después de seleccionar la acción de tabla Sobrescribir.
Por último, en la página Revisar + guardar del asistente de copia de datos, revise la configuración. Para este aprendizaje, desmarque la casilla de verificación Iniciar transferencia de datos inmediatamente, ya que ejecutamos la actividad manualmente en el siguiente paso. Después, seleccione Aceptar.
Paso 3: Ejecutar y ver los resultados de la actividad de copia.
Seleccione la ficha Ejecutar en el editor de canalizaciones. A continuación, seleccione el botón Ejecutar y, a continuación, Guardar y ejecutar en la solicitud para ejecutar la actividad Copiar.
Puede monitorear la ejecución y verificar los resultados en la pestaña Salida debajo del lienzo de la tubería. Seleccione el botón de detalles de ejecución (el icono "gafas" que aparece al mantener el puntero sobre la ejecución de la canalización en ejecución) para ver los detalles de la ejecución.
Los detalles de ejecución muestran 1.508.501 filas leídas y escritas.
Expanda la sección Desglose de la duración para ver la duración de cada etapa de la actividad de copia. Después de revisar los detalles de la copia, seleccione Cerrar.
Contenido relacionado
En este primer módulo de nuestro tutorial completo para su primera integración de datos mediante Data Factory en Microsoft Fabric, ha aprendido a:
- Cree el canal de datos.
- Agregue un actividad de copia a la canalización.
- Use datos de ejemplo y cree un data Lakehouse para almacenar los datos en una nueva tabla.
- Ejecute la canalización y vea sus detalles y desglose de duración.
Continúa a la siguiente sección ahora para crear tu flujo de datos.