次の方法で共有


[データの変換]

重要

Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。

2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。

ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。

この記事では、データ変換のために Machine Learning Studio (クラシック) で提供されるモジュールの一覧を示します。 機械学習の場合、 データ変換には 、データセットの結合や列名の変更など、非常に一般的なタスクが必要です。 ただし、正規化、ビン分割とグループ化、欠損値の推論など、機械学習に固有の多くのタスクも含まれています。

注意

適用対象: Machine Learning Studio (クラシック) のみ

類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。

重要

Machine Learning Studio (クラシック) で使用するデータは、通常、Machine Learning Studio (クラシック) にインポートする前に "整体" する必要があります。 たとえば、データの準備には、データが正しいエンコードを使用していることを確認し、データに一貫性のあるスキーマが含まれるチェックが含まれる場合があります。

データ変換のモジュールは、次のタスク ベースのカテゴリにグループ化されます。

  • デジタル信号処理用のフィルターの作成: デジタル信号フィルターを数値データに適用して、画像認識、音声認識、波形分析などの機械学習タスクをサポートできます。
  • カウントベースの特徴の生成と使用: カウントベースの特徴付けモジュールは、機械学習で使用するコンパクトな機能を開発するのに役立ちます。
  • 一般的なデータ操作と準備: データセットのマージ、欠損値のクリーンアップ、データのグループ化と集計、列名とデータ型の変更、またはラベルまたは特徴である列の指定。
  • データセットのサンプリングと分割: データをトレーニング セットとテスト セットに分割したり、データセットを割合で分割したり、フィルター条件で分割したり、サンプリングを実行したりします。
  • データのスケーリングと縮小: 正規化またはスケーリングを適用して、数値データを分析用に準備します。 データをグループにビン分割したり、外れ値を削除または置換したり、プリンシパル コンポーネント分析 (PCA) を実行したりします。

モジュールの一覧

データ変換カテゴリには、次のモジュール カテゴリが含 まれています。

こちらもご覧ください