ARFF への変換
重要
Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。
2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。
- ML Studio (クラシック) から Azure Machine Learning への機械学習プロジェクトの移動に関する情報を参照してください。
- Azure Machine Learning についての詳細を参照してください。
ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。
データ入力を Weka ツールセットで使用される属性リレーションシップ ファイル形式に変換します
Category: データ形式の変換
注意
適用対象: Machine Learning Studio (クラシック)のみ
類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。
モジュールの概要
この記事では、Machine Learning Studio (クラシック) のarff への変換モジュールを使用して、データセットと結果を weka ツールセットで使用される属性関連ファイル形式に変換する方法について説明します。 この形式は ARFF と呼ばれます。
Weka の ARFF データ仕様では、データの前処理、分類、機能の選択など、複数の機械学習タスクがサポートされています。 この形式では、データはエンティティとその属性によって整理され、1つのテキストファイルに含まれます。 Weka ファイル形式の詳細については、「 テクニカルノート 」を参照してください。
一般に、weka ファイル形式への変換が必要になるのは、Machine Learning と weka の両方を使用し、トレーニングデータをそれらの間で前後に移動する場合のみです。
Weka ツールセットの詳細については、Wikipedia の記事「 weka (machine learning) 」を参照してください。
警告
Azure Storage で既存の ARFF ファイルを上書きすることはできません。
ARFF への変換の使用方法
ARFF への変換モジュールを実験に追加します。 このモジュールは Machine Learning Studio (クラシック) の [データ形式の変換] カテゴリで確認できます。
データセットを出力する任意のモジュールに、それを接続します。
実験を実行するか、[ ARFF への変換 ] モジュールをクリックして、[ 選択したものを実行] をクリックします。
結果
ローカルフォルダーにデータのコピーを作成するには、[ ARFF への変換] の出力をダブルクリックし、[ ダウンロード ] オプションを選択します。
フォルダーを指定しない場合は、既定のファイル名が適用され、ファイルはローカル ダウンロード ライブラリに保存されます。
注意
このモジュールは、Python または R コードへのエクスポートをサポートしていません。
例
この形式に固有の例は Azure AI Galleryではありません。 ただし、これらの実験では、他の種類の形式変換を示しています。
色ベースのイメージの圧縮: 再現性を確保し、他の分析プラットフォームで使用するために、分析の各部分で使用されるデータセットをファイルにエクスポートします。
二項分類のクロス検証のサンプル: 複数のモデルの結果を、Excel などのツールを使用して比較できるように、クロス検証の結果をファイルにエクスポートします。
テクニカル ノート
このセクションには、実装の詳細、ヒント、よく寄せられる質問への回答が含まれています。
ARFF 形式の例
このセクションでは、ARFF に変換された場合の一般的なデータセットの外観の例を示します。
通常、ARFF データファイルは2つのセクションで構成されています。データソースとスキーマを定義する ヘッダー と、実際のエンティティとその属性を含む data セクションです。
ARFF ヘッダー
ARFF ファイルのヘッダーは、属性の一覧 (列) とそのデータ型を定義します。 ヘッダーには、データ ソースまたはその他の注意事項を記述する複数のコメント行を含めることもできます。
% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}
ヒント
変換するデータセットに列名がない場合は、ARFF への変換を使用する前に、 メタデータの編集 モジュールを使用して列名を追加します。
ARFF データ
データセクションは、コンマ区切り値で構成され、列見出しのない CSV ファイルとよく似ています。
@DATA 5.1,3.5,1.4,0.2,0
このファイル形式の詳細については、Weka Wiki のページ「 Arff (developer version)」を参照してください。
現在の ARFF バージョン
Machine Learning Studio (クラシック) では、arff 3.0 形式を使用して arff ファイルを保存します。
想定される入力
名前 | 型 | 説明 |
---|---|---|
データセット | データ テーブル | 入力データセット |
出力
名前 | 型 | 説明 |
---|---|---|
結果のデータセット | Arff | 出力データセット |