Partager via


Modules linguistiques R

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

cet article répertorie les modules de Machine Learning Studio (classic) qui prennent en charge l’exécution de code R. Ces modules facilitent la publication de modèles R en production et l’utilisation de l’expérience de la communauté du langage R pour résoudre des problèmes réels.

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Cet article décrit également les conditions générales requises pour l’utilisation de R dans Machine Language Studio (Classic) et répertorie les problèmes connus et les astuces.

Liste des modules

La catégorie modules linguistiques R comprend les modules suivants :

Configuration requise lors de l’utilisation de R

avant d’utiliser le script R dans Machine Learning Studio (classic), respectez les conditions suivantes :

  • Si vous avez importé des données qui utilisent des formats CSV ou autres, vous ne pouvez pas lire les données directement au format CSV à partir de votre code R. Utilisez plutôt Convert to DataSet pour préparer les données, avant de les utiliser comme entrée d’un module R.

  • lorsque vous attachez un jeu de données Machine Learning en tant qu’entrée à un module r, le jeu de données est automatiquement chargé dans l’espace de travail r en tant que trame de données, avec le nom de variable dataset.

    Toutefois, vous pouvez définir des trames de données supplémentaires ou modifier le nom de la variable de DataSet par défaut dans votre script R.

  • Les modules R s’exécutent dans un environnement protégé et isolé au sein de votre espace de travail privé. Dans votre espace de travail, vous pouvez créer les trames de données et les variables qui seront utilisées par les différents modules.

    Toutefois, vous ne pouvez pas charger des trames de données R à partir d’un autre espace de travail ou lire des variables créées dans un autre espace de travail, même si cet espace de travail est ouvert dans une session Azure. En outre, vous ne pouvez pas utiliser les modules qui ont une dépendance Java ou qui nécessitent un accès direct au réseau.

Optimisation des tâches de notation R

l’implémentation de R dans l’environnement de Machine Learning Studio (classic) et de l’espace de travail comprend deux composants principaux. Un composant coordonne l’exécution du script et l’autre fournit un accès aux données et un score à haute vitesse. Le composant de notation est optimisé pour améliorer l’évolutivité et les performances.

par conséquent, les espaces de travail R dans Machine Learning Studio (classic) prennent également en charge deux types de tâches de notation, chacun étant optimisé pour des exigences différentes. Vous utilisez généralement le calcul de score fichier par fichier lorsque vous créez une expérience. En général, vous utilisez le service de réponse aux requêtes (RR) pour une notation très rapide, lorsque vous utilisez des scores dans le cadre d’un service Web.

Prise en charge des versions et des packages R

Machine Learning Studio (classic) comprend plus de 500 des packages R les plus populaires. Les packages R que vous pouvez sélectionner varient selon la version de R que vous sélectionnez pour votre expérience :

  • CRAN R
  • Microsoft R Open (MRO 3.2.2 ou MRO 3.4.4)

Chaque fois que vous créez une expérience, vous devez choisir une seule version R à exécuter pour tous les modules de votre expérience.

Liste des packages par version

pour obtenir la liste des packages actuellement pris en charge dans Machine Learning, consultez packages R pris en charge par Machine Learning.

Vous pouvez également ajouter le code suivant à un module exécuter le script R dans votre expérience, puis l’exécuter pour obtenir un jeu de données contenant les noms et les versions des packages. Veillez à définir la version R dans les propriétés du module pour générer la liste correcte pour votre environnement prévu.

data.set <- data.frame(installed.packages())
maml.mapOutputPort("data.set")

Important

Les packages pris en charge dans Machine Language Studio (Classic) changent fréquemment. Si vous avez des doutes quant à la prise en charge d’un package R, utilisez l’exemple de code R fourni pour obtenir la liste complète des packages dans l’environnement actuel.

Étendre les expériences à l’aide du langage R

Il existe de nombreuses façons d'étendre votre expérience en utilisant un script R personnalisé ou en ajoutant des packages R. Voici quelques idées pour vous aider à démarrer :

  • Utilisez le code R pour effectuer des opérations mathématiques personnalisées. Par exemple, il existe des packages R permettant de résoudre des équations différentielles, de générer des nombres aléatoires ou d'exécuter des simulations de type Monte Carlo.

  • Appliquez des transformations personnalisées pour les données. Par exemple, vous pouvez utiliser un package R pour effectuer une interpolation sur des données de série chronologique ou effectuer une analyse linguistique.

  • Utilisez des sources de données différentes. Les modules de script R prennent en charge un ensemble supplémentaire d’entrées, qui peut inclure des fichiers de données au format compressé. Vous pouvez utiliser des fichiers de données Zippés, ainsi que des packages R conçus pour ces sources de données, pour aplatir des données hiérarchiques dans une table de données plat. vous pouvez également les utiliser pour lire des données à partir de Excel et d’autres formats de fichier.

  • Utilisez des métriques personnalisées pour l’évaluation. Par exemple, au lieu d’utiliser les fonctions fournies dans évaluer, vous pouvez importer un package R, puis appliquer ses mesures.

L’exemple suivant illustre le processus global de la façon dont vous pouvez installer de nouveaux packages et utiliser du code R personnalisé dans votre expérience.

Fractionner des colonnes à l’aide de R

Parfois, les données nécessitent une manipulation complète pour extraire des fonctionnalités. Supposons que vous ayez un fichier texte qui contient un ID suivi de valeurs et de notes, séparées par des espaces. Ou supposez que votre fichier texte contient des caractères qui ne sont pas pris en charge par machine Language Studio (Classic).

Il existe plusieurs packages R qui fournissent des fonctions spécialisées pour ces tâches. Le package de bibliothèque splitstackshape contient plusieurs fonctions utiles pour fractionner plusieurs colonnes, même si chaque colonne a un délimiteur différent.

L’exemple suivant montre comment installer les packages nécessaires et fractionner les colonnes. Vous devez ajouter ce code au module exécuter le script R .

#install dependent packages  
install.packages("src/concat.split.multiple/data.table_1.9.2.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.data.table <- library("data.table", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/plyr_1.8.1.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.plyr <- library("plyr", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/Rcpp_0.11.2.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.Rcpp <- library("Rcpp", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/reshape2_1.4.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.reshape2 <- library("reshape2", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
#install actual packages  
install.packages("src/concat.split.multiple/splitstackshape_1.2.0.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.splitstackshape <- library("splitstackshape", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
#Load installed library  
library(splitstackshape)  
  
#Use library method to split & concat  
data <- concat.split.multiple(maml.mapInputPort(1), c("TermsAcceptedUserClientIPAddress", "EmailAddress"), c(".", "@"))  
  
#Print column names to console  
colnames(data)  
  
#Redirect data to output port  
maml.mapOutputPort("data")  

Ressources supplémentaires

Commencez par ce didacticiel qui explique comment créer un module R personnalisé :

Cet article explique en détail les différences entre les deux moteurs de notation, et explique comment choisir une méthode de calcul de score quand vous déployez votre expérience en tant que service Web :

Cette expérience dans le Azure AI Gallery montre comment vous pouvez créer un module R personnalisé qui effectue des formations, des notations et des évaluations :

Cet article, publié sur R-bloggers, montre comment vous pouvez créer votre propre méthode d’évaluation dans Machine Learning :

Aide supplémentaire sur R

Ce site fournit une liste classée des packages que vous pouvez rechercher par Mots clés :

Pour obtenir des exemples de code R supplémentaires et de l'aide sur R et ses applications, consultez les ressources suivantes :

Voir aussi