Leçon 1 : Création du package de base et du package du projet
Au cours de cette leçon, vous allez créer un package ETL simple qui extrait des données d'une seule source de fichier plat, transforme ces données en utilisant deux composants de transformation de recherche et les écrit dans la table de faits FactCurrencyRate de l'entrepôt de données AdventureWorksDW. Dans le cadre de cette leçon, vous allez apprendre à créer de nouveaux packages, ajouter et configurer des sources de données et des destinations et enfin, à utiliser le nouveau flux de contrôle et les composants de flux de données.
Important : |
---|
Pour suivre ce didacticiel, vous devez disposer de la base de données exemple AdventureWorksDW. Pour plus d'informations sur l'installation et le déploiement de la base de données AdventureWorksDW, consultez : Installation des exemples de bases de données AdventureWorks et d'autres exemples via le programme d'installation. |
Connaissances préalables à la création d'un package
Avant de créer un package, vous devez maîtriser les connaissances relatives au formatage utilisé pour les données sources et la destination. Une fois ces connaissances maîtrisées, vous êtes prêt à définir les transformations nécessaires pour mapper les données source avec les données de destination.
Étude de la source
Dans le cadre de ce didacticiel, les données sources sont représentées par un ensemble de données de devises historique contenu dans le fichier plat SampleCurrencyData.txt. Les données sources contiennent les quatre colonnes suivantes : le taux moyen de la devise, une clé de devise, une clé de date et le taux de clôture.
Voici un exemple des données sources contenues dans le fichier SampleCurrencyData.txt :
1.00010001 ARS 9/3/2001 0:00 0.99960016
1.00010001 ARS 9/4/2001 0:00 1.001001001
1.00020004 ARS 9/5/2001 0:00 0.99990001
1.00020004 ARS 9/6/2001 0:00 1.00040016
1.00050025 ARS 9/7/2001 0:00 0.99990001
1.00050025 ARS 9/8/2001 0:00 1.001001001
1.00050025 ARS 9/9/2001 0:00 1
1.00010001 ARS 9/10/2001 0:00 1.00040016
1.00020004 ARS 9/11/2001 0:00 0.99990001
1.00020004 ARS 9/12/2001 0:00 1.001101211
Pour bien utiliser des données sources issues d'un fichier plat, il est important de comprendre comment le Gestionnaire de connexions de fichiers plats interprète les données du fichier plat. Si le fichier plat est au format Unicode, le Gestionnaire de connexions de fichiers plats définit toutes les colonnes avec le type [DT_WSTR] et une largeur par défaut égale à 50. Si le fichier plat est au format ANSI, les colonnes sont définies avec le type [DT_STR] et une largeur égale à 50. Il vous faudra probablement modifier ces valeurs par défaut pour affecter aux colonnes des types string plus appropriés à vos données. Pour cela, vous allez examiner le type de données de la destination dans laquelle les données seront enregistrées, puis choisir le type de données qui convient dans le Gestionnaire de connexions de fichiers plats.
Étude de la destination
La destination finale des données sources est la table de faits FactCurrencyRate dans l'entrepôt de données AdventureWorksDW. La table de faits FactCurrencyRate contient quatre colonnes et des relations avec deux tables de dimension comme illustré ci-après.
Nom de la colonne | Type de données | Table de recherche | Colonne de recherche |
---|---|---|---|
AverageRate |
float |
Non |
Non |
CurrencyKey |
int (FK) |
DimCurrency |
CurrencyKey (PK) |
TimeKey |
Int (FK) |
DimTime |
TimeKey (PK) |
EndOfDayRate |
float |
Non |
Non |
Mappage des données sources pour la compatibilité avec la destination
L'analyse du format des données sources et de destination indique que les recherches seront nécessaires pour les valeurs CurrencyKey et TimeKey. Les transformations effectuées par ces recherches permettront d'obtenir les valeurs CurrencyKey et TimeKey en utilisant les autres clés des tables de dimension DimCurrency et DimTime.
Colonne de fichier plat | Nom de la table | Nom de la colonne | Type de données |
---|---|---|---|
0 |
FactCurrencyRate |
AverageRate |
Float |
1 |
DimCurrency |
CurrencyAlternateKey |
nchar (3) |
2 |
DimTime |
FullDateAlternateKey |
Datetime |
3 |
FactCurrencyRate |
EndOfDayRate |
Float |
Tâches de la leçon
Cette leçon porte sur les tâches suivantes :
- Création d'un nouveau projet Integration Services
- Ajout et configuration d'un Gestionnaire de connexions de fichiers plats
- Ajout et configuration d'un Gestionnaire de connexions OLE DB
- Ajout d'une tâche de flux de données au package
- Ajout et configuration de la source de fichier plat
- Ajout et configuration des transformations de recherche
- Ajout et configuration de la destination OLE DB
- Comment rendre le package de la leçon 1 plus facile à assimiler
- Test de la leçon 1 du Package du didacticiel