[データの変換]
重要
Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。
2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。
- ML Studio (クラシック) から Azure Machine Learning への機械学習プロジェクトの移動に関する情報を参照してください。
- Azure Machine Learning についての詳細を参照してください。
ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。
この記事では、データ変換のために Machine Learning Studio (クラシック) で提供されるモジュールの一覧を示します。 機械学習の場合、 データ変換には 、データセットの結合や列名の変更など、非常に一般的なタスクが必要です。 ただし、正規化、ビン分割とグループ化、欠損値の推論など、機械学習に固有の多くのタスクも含まれています。
注意
適用対象: Machine Learning Studio (クラシック) のみ
類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。
重要
Machine Learning Studio (クラシック) で使用するデータは、通常、Machine Learning Studio (クラシック) にインポートする前に "整体" する必要があります。 たとえば、データの準備には、データが正しいエンコードを使用していることを確認し、データに一貫性のあるスキーマが含まれるチェックが含まれる場合があります。
データ変換のモジュールは、次のタスク ベースのカテゴリにグループ化されます。
- デジタル信号処理用のフィルターの作成: デジタル信号フィルターを数値データに適用して、画像認識、音声認識、波形分析などの機械学習タスクをサポートできます。
- カウントベースの特徴の生成と使用: カウントベースの特徴付けモジュールは、機械学習で使用するコンパクトな機能を開発するのに役立ちます。
- 一般的なデータ操作と準備: データセットのマージ、欠損値のクリーンアップ、データのグループ化と集計、列名とデータ型の変更、またはラベルまたは特徴である列の指定。
- データセットのサンプリングと分割: データをトレーニング セットとテスト セットに分割したり、データセットを割合で分割したり、フィルター条件で分割したり、サンプリングを実行したりします。
- データのスケーリングと縮小: 正規化またはスケーリングを適用して、数値データを分析用に準備します。 データをグループにビン分割したり、外れ値を削除または置換したり、プリンシパル コンポーネント分析 (PCA) を実行したりします。
モジュールの一覧
データ変換カテゴリには、次のモジュール カテゴリが含 まれています。