Lección 1: Crear el proyecto y el paquete básico
En esta lección, creará un paquete ETL que extrae datos de un único origen de archivo plano, transforma los datos utilizando dos componentes de la transformación de búsqueda y escribe dichos datos en la tabla de hechos FactCurrencyRate en AdventureWorksDW. Como parte de esta lección, aprenderá a crear paquetes nuevos, agregar y configurar orígenes de datos y conexiones de destino, y trabajar con nuevos componentes de flujo de control y flujo de datos.
Importante: |
---|
Para este tutorial, se necesita la base de datos de ejemplo AdventureWorksDW. Para obtener más información sobre la instalación e implementación de AdventureWorksDW, vea Ejecutar el programa de instalación para instalar los ejemplos y las bases de datos de ejemplo AdventureWorks. Ejecutar el programa de instalación para instalar los ejemplos y las bases de datos de ejemplo AdventureWorks. |
Descripción de los requisitos de paquete
Antes de crear un paquete, debe saber qué formato se utiliza en los datos de origen y de destino. Una vez que conozca ambos formatos de datos, estará listo para definir las transformaciones necesarias para asignar los datos de origen al destino.
Información sobre el origen
En este tutorial, los datos de origen son un conjunto de datos de moneda históricos que se encuentran en un archivo plano, SampleCurrencyData.txt. Los datos de origen tienen cuatro columnas: el tipo de cambio promedio de la moneda, una clave de moneda, una clave de fecha y un tipo de cambio del final del día.
A continuación se muestra un ejemplo de datos de origen del archivo SampleCurrencyData.txt:
1.00010001 ARS 9/3/2001 0:00 0.99960016
1.00010001 ARS 9/4/2001 0:00 1.001001001
1.00020004 ARS 9/5/2001 0:00 0.99990001
1.00020004 ARS 9/6/2001 0:00 1.00040016
1.00050025 ARS 9/7/2001 0:00 0.99990001
1.00050025 ARS 9/8/2001 0:00 1.001001001
1.00050025 ARS 9/9/2001 0:00 1
1.00010001 ARS 9/10/2001 0:00 1.00040016
1.00020004 ARS 9/11/2001 0:00 0.99990001
1.00020004 ARS 9/12/2001 0:00 1.001101211
Cuando se trabaja con datos de origen de un archivo plano, es importante entender el modo en que el administrador de conexión de archivos planos interpreta los datos del archivo plano. Si el origen del archivo plano es Unicode, el administrador de conexión de archivos planos define todas las columnas como [DT_WSTR] con un ancho predeterminado de 50. Si el origen de archivo plano está codificado en ANSI, las columnas se definen como [DT_STR] con un ancho de 50. Es muy probable que deba cambiar estos valores predeterminados de columna para que los tipos de columna de cadena sean más apropiados para sus datos. Para ello, deberá saber cuál es el tipo de datos del destino en el que se escribirán los datos y luego seleccionar el tipo correcto dentro del administrador de conexión de archivos planos.
Información sobre el destino
El destino último de los datos de origen es la tabla de hechos FactCurrencyRate de AdventureWorksDW. La tabla de hechos FactCurrencyRate tiene cuatro columnas y tiene relaciones con dos tablas de dimensiones, como se muestra en la tabla siguiente.
Nombre de columna | Tipo de datos | Tabla de búsqueda | Columna de búsqueda |
---|---|---|---|
AverageRate |
float |
Ninguna |
Ninguna |
CurrencyKey |
int (FK) |
DimCurrency |
CurrencyKey (PK) |
TimeKey |
int (FK) |
DimTime |
TimeKey (PK) |
EndOfDayRate |
float |
Ninguna |
Ninguna |
Asignar datos de origen para que sean compatibles con el destino
El análisis de formatos de datos de origen y destino indica que las búsquedas serán necesarias para los valores CurrencyKey y TimeKey. Las transformaciones que realizarán estas búsquedas obtendrán los valores de CurrencyKeyy TimeKey utilizando las claves alternativas de las tablas de dimensiones DimCurrency y DimTime.
Columna de archivo plano | Nombre de tabla | Nombre de columna | Tipo de datos |
---|---|---|---|
0 |
FactCurrencyRate |
AverageRate |
Float |
1 |
DimCurrency |
CurrencyAlternateKey |
nchar (3) |
2 |
DimTime |
FullDateAlternateKey |
Datetime |
3 |
FactCurrencyRate |
EndOfDayRate |
Float |
Tareas de la lección
Esta lección contiene las tareas siguientes:
- Crear un nuevo proyecto de Integration Services
- Agregar y configurar un administrador de conexión de archivos planos
- Agregar y configurar un administrador de conexión OLE DB
- Agregar una tarea de flujo de datos al paquete
- Agregar y configurar el origen de archivo plano
- Agregar y configurar transformaciones de búsqueda
- Agregar y configurar el destino de OLE DB
- Facilitar la comprensión del paquete de la lección 1
- Probar el paquete del tutorial de la lección 1