Azure Machine Learning デザイナーのアルゴリズムとコンポーネントのリファレンス
適用対象: Python SDK azure-ai-ml v2 (現行)
Note
デザイナーは、従来の事前構築済みコンポーネントとカスタム コンポーネントの 2 種類のコンポーネントをサポートします。 これら 2 種類のコンポーネントには互換性がありません。
従来の事前構築済みコンポーネントは、主にデータ処理や従来の機械学習タスク (回帰や分類など) に事前構築済みのコンポーネントを提供します。 この種類のコンポーネントは引き続きサポートされますが、新しいコンポーネントは追加されません。
カスタム コンポーネントを使用すると、独自のコードをコンポーネントとして提供できます。 ワークスペース間での共有と、Studio、CLI、SDK インターフェイス間でのシームレスな作成ができるようになります。
この記事は、従来の事前構築済みコンポーネントに適用されます。
このリファレンス コンテンツでは、Azure Machine Learning デザイナーで使用可能な従来の各事前構築済みコンポーネントの技術的な背景について説明します。
各コンポーネントは、個別に実行可能なコードのセットを表し、必要な入力を取得して機械学習タスクを実行します。 コンポーネントには、特定のアルゴリズムが含まれているものや、機械学習において重要なタスク (欠損値の置換、統計分析など) を実行するものがあります。
アルゴリズムの選択の詳細については、以下を参照してください。
ヒント
デザイナー内のパイプラインでは、特定のコンポーネントに関する情報を取得できます。 コンポーネントの一覧またはコンポーネントの右側のウィンドウでコンポーネントをポイントするときに、コンポーネントカードの詳細情報リンクを選択します。
データ準備コンポーネント
機能 | 説明 | コンポーネント |
---|---|---|
データの入力と出力 | クラウド ソースのデータをパイプラインに移動します。 パイプラインの実行中に、結果や中間データを Azure Storage、SQL Database に書き込みます。また、クラウド ストレージを使用して、パイプライン間でデータを交換します。 | データの手動入力 データのエクスポート データのインポート |
[データの変換] | 機械学習に固有のデータに対する操作 (データの正規化やビン分割、次元削減、さまざまなファイル形式の間でのデータの変換など)。 | 列の追加 行の追加 算術演算の適用 SQL 変換の適用 見つからないデータのクリーンアップ クリップの値 CSV への変換 データセットへの変換 インジケーター値への変換 メタデータの編集 データをビンにグループ化する データの結合 データの正規化 パーティションとサンプル 重複する行の削除 SMOTE 列変換の選択 データセット内の列の選択 データの分割 |
特徴選択 | 分析モデルの構築で使用する、関連する有用な機能のサブセットを選択します。 | フィルターに基づく特徴選択 順列の特徴量の重要度 |
統計関数 | データ サイエンスに関連するさまざまな統計的方法を提供します。 | データの集計 |
機械学習のアルゴリズム
機能 | 説明 | コンポーネント |
---|---|---|
回帰 | 値を予測します。 | ブースト デシジョン ツリー回帰 デシジョン フォレスト回帰 高速フォレスト分位点回帰 線形回帰 ニューラル ネットワーク回帰 ポワソン回帰 |
クラスタリング | データをグループ化します。 | K-Means クラスタリング |
分類 | クラスを予測します。 バイナリ (2 クラス) または多クラスのアルゴリズムを選択します。 | 多クラスの増幅デシジョン ツリー 多クラス デシジョン フォレスト 多クラス ロジスティック回帰 多クラス ニューラル ネットワーク 1 対全多クラス One vs.One Multiclass 2 クラス平均化パーセプトロン 2 クラス ブースト デシジョン ツリー 2 クラス デシジョン フォレスト 2 クラス ロジスティック回帰 2 クラス ニューラル ネットワーク 2 クラス サポート ベクター マシン |
モデルを構築および評価するためのコンポーネント
機能 | 説明 | コンポーネント |
---|---|---|
モデル トレーニング | アルゴリズムを介してデータを実行します。 | クラスタリング モデルのトレーニング モデルのトレーニング PyTorch モデルのトレーニング モデルのハイパーパラメーターの調整 |
モデルのスコアリングと評価 | トレーニング済みモデルの正確性を測定します。 | 変換の適用 クラスターへのデータの割り当て モデルのクロス検証 モデルの評価 画像モデルのスコア付け モデルのスコア付け |
Python 言語 | コードを記述し、それをコンポーネント内に埋め込んで、Python をパイプラインと統合します。 | Python モデルの作成 Python スクリプトの実行 |
R 言語 | コードを記述し、それをコンポーネント内に埋め込んで、R をパイプラインと統合します。 | R スクリプトの実行 |
Text Analytics | 構造化テキストと非構造化テキストの両方を操作するための特別な計算ツールを提供します。 | 単語からベクトルへの変換 テキストからの N Gram 特徴抽出 特徴ハッシュ テキストの前処理 Latent Dirichlet Allocation Score Vowpal Wabbit Model (Vowpal Wabbit モデルのスコアリング) Train Vowpal Wabbit Model (Vowpal Wabbit モデルのトレーニング) |
Computer Vision | 画像データの前処理と画像認識関連のコンポーネント。 | イメージ変換の適用 イメージ ディレクトリへの変換 イメージ変換の初期化 イメージ ディレクトリの分割 DenseNet ResNet |
推奨 | 推奨モデルを構築します。 | レコメンダーの評価 SVD レコメンダーのスコア付け ワイドかつディープなレコメンダーのスコア付け SVD レコメンダーのトレーニング ワイドかつディープなレコメンダーのトレーニング |
異常検出 | 異常検出モデルを構築します。 | PCA ベースの異常検出 異常検出モデルのトレーニング |
Web サービス
Azure Machine Learning デザイナーでリアルタイムの推論を行うために必要な Web サービス コンポーネントについて説明します。
エラー メッセージ
Azure Machine Learning デザイナーでコンポーネントを使用しているときに発生する可能性のあるエラー メッセージと例外コードについて説明します。
コンポーネントの環境
デザイナーの組み込みコンポーネントはすべて、Microsoft によって提供される固定環境で実行されます。
以前、この環境は Python 3.6 に基づいていましたが、現在は Python 3.8 にアップグレードされています。 このアップグレードは、Python 3.8 環境で自動的にコンポーネントで実行されるため透過的に行われ、ユーザーによる操作は必要ありません。 環境の更新は、コンポーネントの出力とリアルタイム推論からのリアルタイム エンドポイントのデプロイに影響する可能性があります。詳しくは以下のセクションを参照してください。
コンポーネントの出力が以前の結果と異なる
Python バージョンが 3.6 から 3.8 にアップグレードされると、それに応じて組み込みコンポーネントの依存関係もアップグレードされる場合があります。 そのため、一部のコンポーネントの出力が以前の結果と異なる場合があります。
Execute Python Script コンポーネントを使用しているときに、Python 3.6 に関連付けられているパッケージを以前にインストールしている場合は、次のようなエラーが発生する可能性があります。
- "Could not find a version that satisfies the requirement. (要件を満たすバージョンが見つかりません。)"
- "No matching distribution found. (一致するディストリビューションが見つかりません。)" 次に、Python 3.8 に適合するパッケージ バージョンを指定し、パイプラインをもう一度実行する必要があります。
リアルタイム推論パイプラインからリアルタイム エンドポイントをデプロイに関する問題
以前に完了したリアルタイム推論パイプラインからリアルタイム エンドポイントを直接デプロイすると、エラーが発生する可能性があります。
推奨事項: 推論パイプラインを複製し、もう一度送信してから、リアルタイム エンドポイントにデプロイします。