Fonctions statistiques
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
cet article décrit les modules de Machine Learning Studio (classic) qui prennent en charge les opérations mathématiques et statistiques critiques pour les Machine Learning. Si vous devez effectuer des tâches telles que les suivantes dans votre expérience, recherchez dans la catégorie fonctions statistiques :
- Effectuez des calculs ad hoc sur des valeurs de colonne, telles que l’arrondi ou l’utilisation d’une valeur absolue.
- Les moyennes de calcul, les logarithmes et les autres statistiques couramment utilisés dans Machine Learning.
- Calculez les scores de corrélation et de probabilité.
- Calculez les scores z.
- Calculez des distributions statistiques largement utilisées, telles que Weibull, gamma et beta.
- Générez des rapports statistiques sur un ensemble de colonnes ou un jeu de données.
Notes
s’applique à: Machine Learning Studio (classic) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
Par exemple, si vous disposez d’un nouveau jeu de données, vous pouvez d’abord utiliser le module synthétiser les données . Il génère un rapport pour un jeu de données complet qui comprend des mesures statistiques standard, telles que la moyenne et l’écart type.
Si vous avez besoin de statistiques plus avancées, telles que l’exemple d’asymétrie ou la distance interquartile, utilisez le module Compute élémentaire Statistics pour générer des statistiques descriptives supplémentaires.
Étant donné que les modules génèrent les résultats chaque fois que vous exécutez l’expérience, les résultats sont mis à jour si vos données changent.
Liste des modules
La catégorie des fonctions statistiques comprend les modules suivants :
- Application mathématique Apply: applique une opération mathématique aux valeurs de colonne.
- Calculer les statistiques élémentaires: calcule les statistiques de résumé spécifiées pour les colonnes de DataSet sélectionnées.
- Compute Linear correlation: calcule la corrélation linéaire entre les valeurs de colonne dans un DataSet.
- Évaluer la fonction de probabilité: ajuste une fonction de distribution de probabilité spécifiée à un jeu de données.
- Remplacement des valeurs discrètes: remplace les valeurs discrètes d’une colonne par des valeurs numériques basées sur une autre colonne.
- Résumer les données: génère un rapport de statistiques de base descriptif pour les colonnes d’un DataSet.
- Hypothèse de test utilisant t-test: compare les moyennes de deux jeux de données à l’aide d’un test t.