次の方法で共有


マイニング モデルとマイニング構造のカスタマイズ

現在のビジネス ニーズに合ったアルゴリズムを選択した後、マイニング モデルを次の方法でカスタマイズできます。モデルをカスタマイズすると、より良い結果を得られる場合があります。

  • モデルで使用するデータ列、または列の使用法や、コンテンツの種類、分離メソッドを変更する。

  • マイニング モデルに対するフィルターを作成して、モデルのトレーニングに使用するデータを制限する。

  • データを分析するために使用されたアルゴリズムを変更する。

  • アルゴリズム パラメーターを設定して、しきい値やツリーの分割などの重要な条件を制御する。

このトピックでは、これらのオプションについて説明します。

モデルで使用するデータの変更

モデルで使用するデータ列や、そのデータの使用方法および処理方法に関する決定は、分析の結果に大きく影響します。 以下のトピックには、それらの選択に役立つ情報が含まれています。

機能の選択の使用

Analysis Services のほとんどのデータ マイニング アルゴリズムでは、 特徴選択 と呼ばれるプロセスを使用して、モデルに追加するために最も有用な属性のみを選択します。 列や属性の数を減らすと、パフォーマンスやモデルの品質を向上させることができます。 使用できる機能の選択の方法は、選択するアルゴリズムによって異なります。

機能の選択 (データ マイニング)

使用方法の変更

マイニング モデルに含まれる列と各列の使用方法を変更できます。 予期したとおりの結果が得られない場合は、入力として使用した列を調べて、選択した列が適切かどうかを検討する必要があります。さらに、データの処理を向上させるためにできることがあるかどうかについても検討します。たとえば、次のようなことが考えられます。

  • 誤って数値としてラベルが付けられたカテゴリ変数を特定する。

  • カテゴリを追加して、属性の数を減らし、相関関係をわかりやすくする。

  • 数値をビン分割または分離する方法を変更する。

  • 一意の値が多数含まれている列や実際には参照データであるが分析に適さない列 (住所、ミドル ネームなど) を削除する。

マイニング構造から列を物理的に削除する必要はありません。列に [無視] というフラグを付けることができます。 列はマイニング モデルから削除されますが、その列は引き続き構造内の他のマイニング モデルで使用することや、ドリルスルー クエリで参照することができます。

モデル列の別名の作成

Analysis Services は、マイニング モデルを作成するときに、マイニング構造にあるのと同じ列名を使用します。 マイニング モデルのすべての列に、別名を追加できます。 こうすると、列の内容や使用法がわかりやすくなったり、名前が短くなるためクエリを作成しやすくなったりします。 別名は、列のコピーを作成し、わかりやすい名前を付ける場合にも便利です。

別名を作成するには、マイニング モデル列の Name プロパティを編集します。 Analysis Services では、列の ID として元の名前が引き続き使用され、入力 Name した新しい値が列の別名になり、列の使用法の横にあるかっこで囲まれたグリッドに表示されます。

マイニング モデル列のエイリアス マイニング モデル列

この図には、すべて収入に関連したマイニング構造列の複数のコピーを持つ関連モデルを示しています。 構造列のコピーは、それぞれ異なる方法で分離されています。 図のモデルでは、それぞれ異なる列をマイニング構造から使用していますが、モデル間で列を比較しやすくするため、各モデルの列名を [収入] に変更しました。

フィルターの追加

マイニング モデルにはフィルターを追加できます。 フィルターは、モデル ケース内のデータをあるサブセットに制限する一連の WHERE 条件です。 フィルターは、モデルのトレーニング時に使用します。必要に応じて、モデルのテスト時や、精度チャートの作成時にも使用できます。

フィルターを追加することによって、マイニング構造を再利用して、広範なデータのサブセットに基づくモデルを作成できます。 また、フィルターを使用して、特定の行を除外し、分析の質を高めることもできます。

詳細については、「 マイニング モデルのフィルター (Analysis Services - データ マイニング)」を参照してください。

アルゴリズムの変更

マイニング構造に追加した新しいモデルが同じデータ セットを共有していても、(データでサポートされている) 別のアルゴリズムを使用することや、アルゴリズムのパラメーターを変更することで、異なる結果を得ることができます。 また、モデリング フラグを設定することもできます。

アルゴリズムの選択によって、どのような結果が得られるかが決まります。 特定のアルゴリズムのしくみ、または特定のアルゴリズムを使用してメリットを得られるビジネス シナリオの一般的な情報については、「 データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。

各アルゴリズムの要件、制限、およびサポートされているカスタマイズの詳細については、各アルゴリズムのテクニカル リファレンス トピックを参照してください。

Microsoft デシジョン ツリー アルゴリズム Microsoft Time Series アルゴリズム
Microsoft クラスタリング アルゴリズム Microsoft ニューラル ネットワーク アルゴリズム
Microsoft Naive Bayes アルゴリズム Microsoft ロジスティック回帰アルゴリズム
Microsoft アソシエーション アルゴリズム Microsoft 線形回帰アルゴリズム
Microsoft シーケンス クラスタリング アルゴリズム

アルゴリズム パラメーターのカスタマイズ

各アルゴリズムでは、アルゴリズムの動作をカスタマイズしたり、モデルの結果を細かく調整したりするために使用できるパラメーターがサポートされています。 各パラメーターの使用方法については、以下のトピックを参照してください。

これらのトピックには、それぞれのアルゴリズムに基づくモデルで使用できる予測関数の一覧も含まれています。

プロパティ名 適用対象
AUTO_DETECT_PERIODICITY Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
CLUSTER_COUNT Microsoft クラスタリング アルゴリズム テクニカル リファレンス

Microsoft シーケンス クラスタリング アルゴリズム テクニカル リファレンス
CLUSTER_SEED Microsoft クラスタリング アルゴリズム テクニカル リファレンス
CLUSTERING_METHOD Microsoft クラスタリング アルゴリズム テクニカル リファレンス
COMPLEXITY_PENALTY Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
FORCE_REGRESSOR Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス

Microsoft 線形回帰アルゴリズム テクニカル リファレンス

モデリング フラグ (データ マイニング)
FORECAST_METHOD Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
HIDDEN_NODE_RATIO Microsoft Neural Network Algorithm Technical Reference
HISTORIC_MODEL_COUNT Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
HISTORICAL_MODEL_GAP Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
HOLDOUT_PERCENTAGE Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス

Microsoft Neural Network Algorithm Technical Reference

注: このパラメーターは、マイニング構造に適用される提示データ割合値とは異なります。
HOLDOUT_SEED Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス

Microsoft Neural Network Algorithm Technical Reference

注: このパラメーターは、マイニング構造に適用される提示データのシード値とは異なります。
INSTABILITY_SENSITIVITY Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
MAXIMUM_INPUT_ATTRIBUTES Microsoft クラスタリング アルゴリズム テクニカル リファレンス

Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス

Microsoft 線形回帰アルゴリズム テクニカル リファレンス

Microsoft Naive Bayes アルゴリズム テクニカル リファレンス

Microsoft Neural Network Algorithm Technical Reference

Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス
MAXIMUM_ITEMSET_COUNT Microsoft アソシエーション アルゴリズム テクニカル リファレンス
MAXIMUM_ITEMSET_SIZE Microsoft アソシエーション アルゴリズム テクニカル リファレンス
MAXIMUM_OUTPUT_ATTRIBUTES Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス

Microsoft 線形回帰アルゴリズム テクニカル リファレンス

Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス

Microsoft Naive Bayes アルゴリズム テクニカル リファレンス

Microsoft Neural Network Algorithm Technical Reference
MAXIMUM_SEQUENCE_STATES Microsoft シーケンス クラスタリング アルゴリズム テクニカル リファレンス
MAXIMUM_SERIES_VALUE Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
MAXIMUM_STATES Microsoft クラスタリング アルゴリズム テクニカル リファレンス

Microsoft Neural Network Algorithm Technical Reference

Microsoft シーケンス クラスタリング アルゴリズム テクニカル リファレンス
MAXIMUM_SUPPORT Microsoft アソシエーション アルゴリズム テクニカル リファレンス
MINIMUM_IMPORTANCE Microsoft アソシエーション アルゴリズム テクニカル リファレンス
MINIMUM_ITEMSET_SIZE Microsoft アソシエーション アルゴリズム テクニカル リファレンス
MINIMUM_DEPENDENCY_PROBABILITY Microsoft Naive Bayes アルゴリズム テクニカル リファレンス
MINIMUM_PROBABILITY Microsoft アソシエーション アルゴリズム テクニカル リファレンス
MINIMUM_SERIES_VALUE Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
MINIMUM_SUPPORT Microsoft アソシエーション アルゴリズム テクニカル リファレンス

Microsoft クラスタリング アルゴリズム テクニカル リファレンス

Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス

Microsoft シーケンス クラスタリング アルゴリズム テクニカル リファレンス

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
MISSING_VALUE_SUBSTITUTION Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
MODELLING_CARDINALITY Microsoft クラスタリング アルゴリズム テクニカル リファレンス
PERIODICITY_HINT Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
PREDICTION_SMOOTHING Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
SAMPLE_SIZE Microsoft クラスタリング アルゴリズム テクニカル リファレンス

Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス

Microsoft Neural Network Algorithm Technical Reference
SCORE_METHOD Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス
SPLIT_METHOD Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス
STOPPING_TOLERANCE Microsoft クラスタリング アルゴリズム テクニカル リファレンス

参照

データ マイニング アルゴリズム (Analysis Services - データ マイニング)物理アーキテクチャ (Analysis Services - データ マイニング)