データ マイニング モデルのカスタマイズ (Analysis Services - データ マイニング)
現在のビジネス ニーズに合ったアルゴリズムを選択した後、マイニング モデルを次の方法でカスタマイズできます。モデルをカスタマイズすると、より良い結果を得られる場合があります。
モデルで使用するデータ列、または列の使用法やコンテンツの種類を変更する。
マイニング モデルに対するフィルタを作成して、モデルのトレーニングに使用するデータを制限する。
アルゴリズム パラメータを設定して、しきい値やツリーの分割などの条件を制御する。
データの分析や予測に使用される既定のアルゴリズムを変更する。
モデルで使用するデータの変更
モデルで使用するデータ列や、そのデータの使用方法および処理方法に関する決定は、分析の結果に大きく影響します。以下のトピックには、それらの選択に役立つ情報が含まれています。
マイニング モデル (Analysis Services - データ マイニング)
マイニング モデルのアーキテクチャの概要について、基になるマイニング構造やマイニング列の選択を含めて説明します。
マイニング モデルのフィルタの作成 (Analysis Services - データ マイニング)
マイニング モデルに適用されるフィルタを作成して、マイニング構造データのサブセットに基づくモデルを作成する方法を説明します。
-
Analysis Services で、機能の選択というプロセスがどのように使用されるのかを説明します。機能の選択を使用すると、最も役に立つ属性のみを選択してモデルに追加することができます。列や属性の数を減らすと、パフォーマンスやモデルの品質を向上させることができます。使用できる機能の選択の方法は、選択するアルゴリズムによって異なります。
データ マイニング ウィザードを使用する場合は、特定のモデルを作成するうえで最も役に立つデータが自動的に選択されるようにすることもできます。
アルゴリズムの設定のカスタマイズ
アルゴリズムの選択によって、どのような結果が得られるかが決まります。特定のアルゴリズムがどのように動作し、どのようなビジネス シナリオで役立つかについては、「データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。
Analysis Services で提供されるデータ マイニング アルゴリズムは、広範なカスタマイズにも対応しています。アルゴリズムのパラメータを設定することにより、そのアルゴリズムの動作やデータの処理方法を制御できます。各アルゴリズムがサポートするパラメータの詳細については、次のトピックを参照してください。
Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス
Microsoft クラスタリング アルゴリズム テクニカル リファレンス
Microsoft Naive Bayes アルゴリズム テクニカル リファレンス
Microsoft アソシエーション アルゴリズム テクニカル リファレンス
Microsoft シーケンス クラスタリング アルゴリズム テクニカル リファレンス
Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス
Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス
Microsoft 線形回帰アルゴリズム テクニカル リファレンス
Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス
これらのトピックには、それぞれのアルゴリズムに基づくモデルで使用できる予測関数の一覧も含まれています。
アルゴリズム パラメータの一覧
各アルゴリズムでは、アルゴリズムの動作をカスタマイズしたり、モデルの結果を細かく調整したりするために使用できるパラメータがサポートされています。各パラメータの使用方法については、以下のトピックを参照してください。
プロパティ名 |
適用対象 |
---|---|
AUTO_DETECT_PERIODICITY |
|
CLUSTER_COUNT |
|
CLUSTER_SEED |
|
CLUSTERING_METHOD |
|
COMPLEXITY_PENALTY |
|
FORCED_REGRESSOR |
|
FORECAST_METHOD |
|
HIDDEN_NODE_RATIO |
|
HISTORIC_MODEL_COUNT |
|
HISTORICAL_MODEL_GAP |
|
HOLDOUT_PERCENTAGE |
Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス
注意
このパラメータは、マイニング構造に適用される提示割合の値とは異なります。
|
HOLDOUT_SEED |
Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス
注意
このパラメータは、マイニング構造に適用される提示されたシードの値とは異なります。
|
INSTABILITY_SENSITIVITY |
|
MAXIMUM_INPUT_ATTRIBUTES |
Microsoft クラスタリング アルゴリズム テクニカル リファレンス Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス Microsoft 線形回帰アルゴリズム テクニカル リファレンス Microsoft Naive Bayes アルゴリズム テクニカル リファレンス |
MAXIMUM_ITEMSET_COUNT |
|
MAXIMUM_ITEMSET_SIZE |
|
MAXIMUM_OUTPUT_ATTRIBUTES |
Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス Microsoft 線形回帰アルゴリズム テクニカル リファレンス Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス |
MAXIMUM_SEQUENCE_STATES |
|
MAXIMUM_SERIES_VALUE |
|
MAXIMUM_STATES |
Microsoft クラスタリング アルゴリズム テクニカル リファレンス |
MAXIMUM_SUPPORT |
|
MINIMUM_IMPORTANCE |
|
MINIMUM_ITEMSET_SIZE |
|
MINIMUM_DEPENDENCY_PROBABILITY |
|
MINIMUM_PROBABILITY |
|
MINIMUM_SERIES_VALUE |
|
MINIMUM_SUPPORT |
Microsoft アソシエーション アルゴリズム テクニカル リファレンス Microsoft クラスタリング アルゴリズム テクニカル リファレンス Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス |
MISSING_VALUE_SUBSTITUTION |
|
MODELLING_CARDINALITY |
|
PERIODICITY_HINT |
|
PREDICTION_SMOOTHING |
|
SAMPLE_SIZE |
Microsoft クラスタリング アルゴリズム テクニカル リファレンス |
SCORE_METHOD |
|
SPLIT_METHOD |
|
STOPPING_TOLERANCE |
その他の要件
データの選択と準備は、データ マイニング プロセスの重要な部分です。たとえば、Microsoft が提供するアルゴリズムでは、重複するキーは使用できません。各モデルで必要となるデータの種類は、アルゴリズムによって異なります。詳細については、次のトピックの「必要条件」を参照してください。
クエリと予測関数による結果のカスタマイズ
モデルを作成して処理したら、それぞれのモデルの種類に固有のビューアを使用して情報を表示できます。また、データ マイニング拡張機能 (DMX) を使用してカスタム クエリを作成すると、データ内で検出されたパターンについてより詳細な情報を入手することができます。
モデル コンテンツを返すクエリの作成方法については、「データ マイニング モデルのクエリ (Analysis Services - データ マイニング)」を参照してください。
関数を使用して、マイニング モデルによって返される結果を拡張できます。結果の確率を表す統計やその他のスコアを返す関数もあります。さらに、個々のアルゴリズムでサポートされている追加の関数もあります。たとえば、クラスタリングを使用するマイニング モデルでは、特殊な関数を使用して、クラスタに関する情報を見つけることができます。一方、時系列アルゴリズムに基づくモデルでは、また別の関数を使用して、予測やモデル コンテンツのクエリを実行することができます。詳細については、各アルゴリズムのテクニカル リファレンス トピックを参照してください。
マイニング モデルのクエリを実行する方法の例や、特定の種類のモデル用の予測関数を使用する方法の例については、「データ マイニング モデルのクエリ (Analysis Services - データ マイニング)」を参照してください。
すべてのアルゴリズムの種類でサポートされている予測関数の一覧については、「クエリ型への関数のマップ (DMX)」を参照してください。
モデルの変更の評価
ビジネス上の問題を解決するためにさまざまなモデルをテストしたり、モデルのバリエーションを作成したりするときは、各モデルの精度を測定し、さらに、各モデルがビジネス上の問題の解決策としてどの程度適しているかを評価する必要があります。データ マイニング モデルの評価に関する一般的な情報については、「データ マイニング モデルの検証 (Analysis Services - データ マイニング)」を参照してください。さまざまなマイニング モデルの精度をグラフ化する方法の詳細については、「モデルの精度をグラフ化するためのツール (Analysis Services - データ マイニング)」を参照してください。