Éditeur de tâche de profilage de données (Page Demandes de profil)
Utilisez la page Demandes de profil de l' Éditeur de tâche de profilage de données pour sélectionner et configurer les profils que vous souhaitez calculer. Au sein d'une seule tâche de profilage des données, vous pouvez calculer plusieurs profils pour plusieurs colonnes ou des combinaisons de colonnes dans plusieurs tables ou vues.
Pour plus d'informations sur l'utilisation de la tâche de profilage de données, consultez Configuration de la tâche de profilage des données. Pour plus d'informations sur l'utilisation de la Visionneuse du profil des données pour analyser le résultat de la tâche de profilage de données, consultez Affichage de la sortie du profil dans la visionneuse du profil des données.
Pour ouvrir la page Demandes de profil de la tâche de profilage de données
Dans Business Intelligence Development Studio, ouvrez le package Integration Services doté de la tâche de profilage de données.
Sous l'onglet Flux de contrôle, double-cliquez sur la tâche de profilage de données.
Dans l' Éditeur de tâche de profilage de données, cliquez sur Demandes de profil.
Utilisation du volet Demandes
Le volet Demandes apparaît en haut de la page. Il répertorie tous les profils configurés pour la tâche de profilage de données actuelle. Si aucun profil n'a été configuré, le volet Demandes est vide. Pour ajouter un nouveau profil, cliquez dans une zone vide sous la colonne Type de profil, puis sélectionnez un type de profil dans la liste. Pour configurer un profil, sélectionnez-le dans le volet Demandes, puis définissez ses propriétés dans le volet Propriétés de la demande.
Options du volet Demandes
Le volet Demandes propose les options suivantes :
Vue
Précisez si vous souhaitez afficher l'ensemble des profils configurés pour la tâche ou simplement l'un d'entre eux.Les colonnes dans le volet Demandes changent selon la vue que vous sélectionnez. Pour plus d'informations sur chacune de ces colonnes, consultez la section suivante « Colonnes du volet Demandes ».
Colonnes du volet Demandes
Les colonnes qui s'affichent dans le volet Demandes dépendent de la vue que vous avez sélectionnée :
Si vous choisissez d'afficher Toutes les demandes, le volet Demandes dévoile deux colonnes : Type de profil et ID de demande.
Si vous choisissez d'afficher l'un des cinq profils de colonne, le volet Demandes fait apparaître quatre colonnes : Type de profil, Table ou vue, Colonne et ID de demande.
Si vous optez pour l'affichage d'un profil de clé candidate, le volet Demandes affiche quatre colonnes : Type de profil, Table ou vue, CléColonnes et ID de demande.
Si vous souhaitez afficher un profil de dépendance fonctionnelle, le volet Demandes propose cinq colonnes : Type de profil, Table ou vue, Colonnes déterminantes, Colonne dépendante et ID de demande.
Dans le cas d'un profil d'inclusion de valeur, le volet Demandes affiche six colonnes : Type de profil, Table ou vue côté sous-ensemble, Table ou vue côté sur-ensemble, Colonnes côté sous-ensemble, Colonnes côté sur-ensemble et ID de demande.
Les sections suivantes décrivent chacune de ces colonnes.
Colonnes communes à toutes les vues
Type de profil
Sélectionnez un profil des données à partir des options suivantes :Valeur
Description
Demande de profil de clé candidate
Calculez un profil de clé candidate.
Ce profil signale si une colonne ou un ensemble de colonnes est une clé, ou une clé approximative, pour la table sélectionnée. Ce profil peut également vous aider à identifier des problèmes dans vos données, tels que des valeurs en double dans une colonne clé potentielle.
Demande de profil de distribution de longueurs de colonne
Calculez un profil de distribution de longueurs de colonne.
Le profil de distribution de longueurs de colonne signale toutes les longueurs distinctes des valeurs de chaîne dans la colonne sélectionnée, ainsi que le pourcentage de lignes dans la table que chaque longueur représente. Ce profil peut vous aider à identifier des problèmes dans vos données, tels que les valeurs non valides. Par exemple, vous profilez une colonne de codes d'états des États-Unis à deux caractères et découvrez des valeurs excédant deux caractères.
Demande de profil de ratio de colonne Null
Calculez un profil de ratio de colonne Null.
Le profil de ratio de colonne Null signale le pourcentage de valeurs Null dans la colonne sélectionnée. Ce profil peut vous aider à identifier des problèmes dans vos données, tels qu'un ratio élevé inattendu de valeurs Null dans une colonne. Par exemple, vous profilez une colonne de codes postaux et découvrez un pourcentage élevé et inacceptable de codes manquants.
Demande de profil de modèle de colonne
Calculez un profil de modèle de colonne.
Le profil de modèle de colonne signale un ensemble d'expressions régulières qui reflètent le pourcentage spécifié pour les valeurs dans une colonne de chaîne. Ce profil peut vous aider à identifier des problèmes dans vos données, tels que les chaînes non valides. Il peut également suggérer des expressions régulières susceptibles d'être utilisées à l'avenir pour la validation de nouvelles valeurs. Par exemple, le profil de modèle d'une colonne de codes postaux peut générer les expressions régulières suivantes : \d{5}-\d{4}, \d{5} et \d{9}. Si vous rencontrez d'autres expressions régulières, il est probable que vos données contiennent des valeurs qui ne sont pas valides ou utilisent un format incorrect.
Demande de profil de statistiques de colonnes
Sélectionnez cette option pour calculer un profil de statistiques de colonnes à l'aide des paramètres par défaut pour toutes les colonnes applicables dans la table ou la vue sélectionnée.
Le profil de statistiques de colonnes répertorie des statistiques, telles que l'écart minimal, maximal, moyen et type pour les colonnes numériques et l'écart minimal et maximal pour les colonnes datetime. Ce profil peut vous aider à identifier des problèmes dans vos données, tels que les dates non valides. Par exemple, vous profilez une colonne de dates historiques et découvrez une date maximum dont l'échéance est à venir.
Demande de profil de distribution de valeurs de colonne
Calculez un profil de distribution de valeurs de colonne.
Le profil de distribution de valeurs de colonne permet de préciser toutes les valeurs distinctes dans la colonne sélectionnée, ainsi que le pourcentage de lignes dans la table que représente chaque valeur. Ce profil peut également signaler des valeurs qui représentent beaucoup plus qu'un pourcentage spécifié dans la table. Ce profil peut vous aider à identifier des problèmes dans vos données, tels qu'un nombre incorrect de valeurs distinctes dans une colonne. Par exemple, vous profilez une colonne qui contient les états des États-Unis et découvrez plus de 50 valeurs distinctes.
Demande de profil de dépendance fonctionnelle
Calculez un profil de dépendance fonctionnelle.
Le profil de dépendance fonctionnelle indique le degré de dépendance entre les valeurs d'une colonne (colonne dépendante) et celles d'une autre colonne ou d'un ensemble de colonnes (colonne déterminante). Ce profil peut également vous aider à identifier des problèmes dans vos données, tels que les valeurs non valides. Par exemple, vous profilez une dépendance entre une colonne États-Unis/Code postal et une colonne des états des États-Unis. Le même code postal doit toujours afficher le même état mais le profil détecte des violations de la dépendance.
Demande de profil d'inclusion de valeur
Calculez un profil d'inclusion de valeur.
Le profil d'inclusion de valeur calcule le chevauchement des valeurs entre deux colonnes ou des ensembles de colonnes. Ce profil permet également de déterminer si une colonne ou un ensemble de colonnes peut servir de clé étrangère entre les tables sélectionnées. Ce profil peut également vous aider à identifier des problèmes dans vos données, tels que les valeurs non valides. Par exemple, vous profilez la colonne ProductID d'une table Sales et découvrez que la colonne contient des valeurs qui sont introuvables dans la colonne ProductID de la table Products.
RequestID
Affiche l'identificateur de la demande. En règle générale, il n'est pas nécessaire de modifier la valeur générée automatiquement.
Colonnes communes à tous les profils individuels
Gestionnaire de connexions
Affiche le gestionnaire de connexions ADO.NET qui se connecte à la base de données source.ID de demande
Affiche un identificateur pour la demande. En règle générale, il n'est pas nécessaire de modifier la valeur générée automatiquement.
Colonnes communes aux cinq profils de colonne individuels
Table ou vue
Affiche la table ou la vue qui contient la colonne sélectionnée.Colonne
Affiche la colonne sélectionnée pour le profilage.
Colonnes spécifiques au profil de clé candidate
Table ou vue
Affiche la table ou la vue qui contient les colonnes sélectionnées.Colonnes clés
Affiche les colonnes sélectionnées pour le profilage.
Colonnes spécifiques au profil de dépendance fonctionnelle
Table ou vue
Affiche la table ou la vue qui contient les colonnes sélectionnées.Colonnes déterminantes
Affiche les colonnes sélectionnées pour le profilage en tant que colonne ou colonnes déterminantes. Dans l'exemple où une colonne États-Unis/Code postal détermine l'état aux États-Unis, la colonne déterminante est la colonne de codes postaux.Colonne dépendante
Affiche les colonnes sélectionnées pour le profilage en tant que colonne dépendante. Dans l'exemple où une colonne États-Unis/Code postal détermine l'état aux États-Unis, la colonne dépendante est celle qui désigne l'état.
Colonnes spécifiques au profil d'inclusion de valeur
Table ou vue côté sous-ensemble
Affiche la table ou la vue qui contient la ou les colonnes sélectionnées en tant que colonnes côté sous-ensemble.Table ou vue côté sur-ensemble
Affiche la table ou la vue qui contient la ou les colonnes sélectionnées en tant que colonnes côté sur-ensemble.Colonnes côté sous-ensemble
Affiche la ou les colonnes sélectionnées pour le profilage en tant que colonnes côté sous-ensemble. Dans l'exemple où vous souhaitez vérifier que les valeurs dans une colonne des états américains apparaissent dans une table de référence de codes d'états américains à deux caractères, la colonne de sous-ensemble correspond à la colonne des états dans la table source.Colonnes côté sur-ensemble
Affiche la ou les colonnes sélectionnées pour le profilage en tant que colonnes côté sur-ensemble. Dans l'exemple où vous souhaitez vérifier que les valeurs dans une colonne des états américains apparaissent dans une table de référence de codes d'états américains à deux caractères, la colonne de sur-ensemble correspond à la colonne des codes d'états dans la table de référence.
Utilisation du volet Propriétés de la demande
Le volet Propriétés de la demande apparaît sous le volet Demandes. Ce volet affiche les options qui concernent le profil que vous avez sélectionné dans le volet Demandes.
Notes
Après avoir choisi un Type de profil, vous devez sélectionner le champ ID de demande pour consulter les propriétés de la demande de profil dans le volet Propriétés de la demande.
Ces options varient selon le profil sélectionné. Pour plus d'informations sur les types de profil individuels, consultez les rubriques suivantes :
Options Demande de profil de clé candidate (tâche de profilage des données)
Options Demande de profil de ratio de colonne Null (tâche de profilage des données)
Options Demande de profil de statistiques de colonnes (tâche de profilage des données)
Options Demande de profil de distribution de valeurs de colonne (tâche de profilage des données)
Options Demande de profil de distribution de longueurs de colonne (tâche de profilage des données)
Options Demande de profil de modèle de colonne (tâche de profilage des données)
Options Demande de profil de dépendance fonctionnelle (tâche de profilage des données)
Options Demande de profil d'inclusion de valeur (tâche de profilage des données)