Convert to ARFF
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
Convertit les données d'entrée au format de fichier ARFF (Attribute Relation File Format) utilisé par l'ensemble d'outils Weka.
Catégorie : conversions de format de données
Notes
s’applique à: Machine Learning Studio (classic) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
Vue d’ensemble du module
cet article explique comment utiliser le module Convert to ARFF dans Machine Learning Studio (classic) pour convertir des jeux de données et des résultats en format de fichier de relation d’attribut utilisé par l’ensemble d’outils Weka. Ce format est appelé ARFF.
La spécification de données ARFF pour weka prend en charge plusieurs tâches Machine Learning, notamment le prétraitement des données, la classification et la sélection des fonctionnalités. Dans ce format, les données sont organisées par entités et leurs attributs, et elles sont contenues dans un seul fichier texte. Pour plus d’informations sur le format de fichier weka, consultez la section Notes techniques .
en général, la conversion au format de fichier Weka est requise uniquement si vous souhaitez utiliser à la fois Machine Learning et Weka, et si vous souhaitez déplacer les données d’apprentissage entre elles.
Pour plus d’informations sur l’ensemble d’outils weka, consultez cet article de Wikipédia : weka (machine learning)
Avertissement
Vous ne pouvez pas remplacer un fichier ARFF existant dans Azure Storage.
Comment utiliser Convert to ARFF
Ajoutez le module Convert to ARFF à votre expérience. vous pouvez trouver ce module dans la catégorie conversions de Format de données dans Machine Learning Studio (classic).
Connectez-le à n’importe quel module qui génère un jeu de données.
Exécutez l’expérience ou cliquez sur le module convertir en ARFF , puis cliquez sur exécuter la sélection.
Résultats
Pour créer une copie des données dans un dossier local, double-cliquez sur la sortie de Convert to ARFFet sélectionnez l’option de Téléchargement .
Si vous ne spécifiez pas de dossier, un nom de fichier par défaut est appliqué et le fichier est enregistré dans la bibliothèque de téléchargements locaux.
Notes
Ce module ne prend pas en charge l’exportation vers du code python ou R.
Exemples
Il n’existe aucun exemple spécifique à ce format dans le Azure ai Gallery. Toutefois, ces expériences illustrent d’autres types de conversion de format :
Compression d’image basée sur des couleurs: exporte les jeux de données utilisés pour chaque partie de l’analyse vers des fichiers pour la reproductibilité et l’utilisation sur d’autres plateformes d’analyse.
Exemple de validation croisée pour la classification binaire: exporte les résultats de la validation croisée dans des fichiers afin que les résultats de plusieurs modèles puissent être comparés à l’aide d’un outil tel que Excel.
Notes techniques
Cette section contient des détails, des conseils et des réponses aux questions fréquentes concernant l’implémentation.
Exemple de format ARFF
Cette section fournit un exemple de l’aspect d’un jeu de données typique lors de la conversion en ARFF.
En général, un fichier de données ARFF est composé de deux sections : un en-tête qui définit la source de données et le schéma, et la section de données , qui contient les entités réelles et leurs attributs.
En-tête ARFF
L’en-tête d’un fichier ARFF définit la liste des attributs (en colonnes) et leurs types de données. L'en-tête peut également contenir plusieurs lignes de commentaire décrivant la source de données ou d'autres notes.
% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}
Conseil
Si le jeu de données que vous convertissez n’a pas de noms de colonnes, utilisez le module modifier les métadonnées pour ajouter des noms de colonnes avant d’utiliser la conversion en ARFF.
Données ARFF
La section de données se compose de valeurs séparées par des virgules et ressemble beaucoup à un fichier CSV sans en-têtes de colonnes.
@DATA 5.1,3.5,1.4,0.2,0
Pour plus d’informations sur ce format de fichier, consultez la page wiki weka : ARFF (version développeur).
Version actuelle de ARFF
Machine Learning Studio (classic) enregistre les fichiers ARFF à l’aide du format ARFF 3,0.
Entrées attendues
Nom | Type | Description |
---|---|---|
Dataset | Table de données | Jeu de données d'entrée |
Sorties
Nom | Type | Description |
---|---|---|
Jeu de données de résultats | Arff | Jeu de données de sortie |
Voir aussi
Conversion des formats de données
Liste alphabétique des modules