Les transformations de données sont utilisées pour :
Préparez les données pour l’entraînement du modèle.
Appliquez un modèle importé au format TensorFlow ou ONNX.
Après le traitement des données après avoir été passées par le biais d’un modèle.
Les transformations abordées dans ce guide retournent des classes qui implémentent l’interface IEstimator. Les transformations de données peuvent s’enchaîner. Chacune transformation attend et génère des données de type et de format spécifiques, indiqués dans le lien de la documentation de référence.
Certaines transformations de données ont besoin de données d’apprentissage pour calculer leurs paramètres. Par exemple, le transformateur NormalizeMeanVariance calcule la moyenne et la variance des données d’apprentissage au cours de l’opération Fit() et utilise ces paramètres dans l’opération Transform().
D’autres transformations de données n’exigent pas les données d’apprentissage. Par exemple, la transformation ConvertToGrayscale peut effectuer l’opération Transform() sans consulter ces données durant l’opération Fit().
Pondérer chacune des valeurs d’une ligne en soustrayant la moyenne des données de la ligne, diviser par l’écart type ou la norme L² (des données de la ligne) et multiplier par un facteur de proportionnalité configurable (par défaut, 2)
Affecter à la valeur d’entrée un index d’emplacement (bin) et diviser par le nombre d’emplacements pour produire une valeur float comprise entre 0 et 1, les limites étant calculées pour distribuer uniformément les données d’apprentissage dans les emplacements
Mettez à l’échelle chaque valeur en utilisant des statistiques robustes pour les valeurs hors norme qui centrent les données autour de 0 et mettez à l’échelle les données en fonction de la plage de quantiles.
Détecter les points de changement dans des données de séries chronologiques indépendantes et identiquement distribuées à l’aide d’estimations de densité de noyau adaptative et de scores martingales
Détecter les pics dans des données de séries chronologiques indépendantes et identiquement distribuées à l’aide d’estimations de densité de noyau adaptative et de scores martingales
Créer une colonne de sortie dont la valeur est définie sur une valeur par défaut s’il manque la valeur de la colonne d’entrée, sur la valeur d’entrée sinon
Mapper chaque vecteur d’entrée à un espace de fonctionnalité dimensionnelle inférieur, où les produits internes se rapprochent d’une fonction de noyau, afin que les fonctionnalités puissent être utilisées comme entrées des algorithmes linéaires
Transforme un score brut de classifieur binaire en une probabilité de classe à l’aide de la régression logistique avec les paramètres estimés à l’aide des données d’entraînement
Transforme un score brut de classifieur binaire en une probabilité de classe en affectant des scores à des emplacements et en calculant la probabilité en fonction de la répartition entre les emplacements
Transforme un score brut de classifieur binaire en une probabilité de classe en affectant des scores à des emplacements, où la position des limites et la taille des emplacements sont estimées à l’aide des données d’entraînement
Appliquer une expression pour transformer des colonnes en nouvelles colonnes
Non
Collaborer avec nous sur GitHub
La source de ce contenu se trouve sur GitHub, où vous pouvez également créer et examiner les problèmes et les demandes de tirage. Pour plus d’informations, consultez notre guide du contributeur.