アルゴリズムパラメーター (SQL Server データマイニングアドイン)

[アーティクル]
03/06/2017

Excel 用のテーブル分析ツールを使用してデータマイニングを実行する場合は、データマイニングのアルゴリズムまたはパラメーターを構成する必要はありません。各ツールによってデータが分析され、最適なパラメーターが自動的に選択されます。ただし、モデルを修正する場合や、マイニングモデルを最初から作成する場合に備えて、Excel 用のデータマイニングクライアントにはカスタマイズのためのオプションがいくつか用意されています。

[ 詳細設定 ] をクリックし、[構造にモデルを追加] をクリックして、データマイニング モデルを手動で作成します。
データマイニングクライアントでモデリングウィザードのいずれかを使用し、[ パラメーター ] をクリックして Microsoft データマイニングアルゴリズムの動作を制御します。
[クエリ] をクリックしてクエリモデルウィザードを開き、[詳細設定] をクリックして [データマイニングの詳細設定] クエリエディターを開きます。このエディターでは、DMX テンプレートを使用してモデルを作成できます。

作成済みのマイニングモデルの動作を変更することや、マイニングモデルビューアーでパラメーターを設定して結果をフィルター処理することもできます。

アルゴリズムパラメーターの一覧

すべての Microsoft アルゴリズムは、パラメーターを設定することでカスタマイズできます。最適なパラメーター設定はデータの構成によって異なるため、パラメーターを変更した場合の影響についてはここでは詳しく説明しません。

次の表では、パラメーターの一覧を示して個々の機能について説明し、詳細な技術情報へのリンクを示します。

パラメーター名	使用される場所	説明
AUTO_DETECT_PERIODICITY	Microsoft Time Series アルゴリズム	周期性を検出するために使用する 0 から 1 までの数値を指定します。この値を 1 に近く設定すると、多くのほぼ定期的なパターンの検出と周期性ヒントの自動生成が優先されます。周期性のヒントを多数処理すると、モデルのトレーニングに非常に長い時間がかかりますが、精度の高いモデルになる可能性があります。より 0 に近い値を設定すると、周期性の高いデータのみを対象にして周期性が検出されます。既定値は 0.6 です。
CLUSTER_COUNT	Microsoft クラスタリングアルゴリズム「Microsoft シーケンスクラスターアルゴリズム」	アルゴリズムによって作成されるクラスターの概数を指定します。その数のクラスターをデータから作成できない場合は、可能な限り多数のクラスターが作成されます。 CLUSTER_COUNT を 0 に設定すると、アルゴリズムではヒューリスティックを使用して、作成するクラスターの数が最適に決定されます。既定値は 10 です。
CLUSTER_SEED	Microsoft クラスタリングアルゴリズム	モデル作成の初期段階にクラスターをランダムに生成するために使用するシード数を指定します。既定値は 0 です。
CLUSTERING_METHOD	Microsoft クラスタリングアルゴリズム	アルゴリズムで使用するクラスタリング手法を指定します。使用可能なクラスタリング手法は、スケーラブル EM (1)、非スケーラブル EM (2)、スケーラブル K-Means (3)、および非スケーラブル K-Means (4) です。既定値は 1 です。
COMPLEXITY_PENALTY	Microsoft デシジョンツリーアルゴリズム Microsoft Time Series アルゴリズム	デシジョンツリーの拡大を制御します。値を小さくすると分割数が増加し、値を大きくすると分割数が減少します。次に示すように、既定値は特定のモデルの属性数に基づいて決定されます。属性数が 1 ～ 9 の場合、既定値は 0.5 です。属性数が 10 ～ 99 の場合、既定値は 0.9 です。属性数が 100 以上の場合、既定値は 0.99 です。注: 時系列モデルでは、このパラメーターは ARTxp アルゴリズムを使用して構築されたモデル、または混合モデルにのみ適用されます。
FORCED_REGRESSOR	Microsoft デシジョンツリーアルゴリズム Microsoft 線形回帰アルゴリズム	アルゴリズムによって計算された列の重要度に関係なく、指定した列をアルゴリズムでリグレッサーとして使用するように設定します。注: このパラメーターは、連続属性を予測しているデシジョンツリーにのみ使用されます。定義上、線形回帰モデルは、連続属性を予測する特殊なデシジョンツリーです。ただし、どのデシジョンツリーモデルにも、線形回帰式を表すノードが含まれている可能性があります。
FORECAST_METHOD	Microsoft Time Series アルゴリズム	予測の作成に、ARTxp アルゴリズム、ARIMA アルゴリズム、または両者の組み合わせのどれを使用するかを指定します。既定値は MIXED です。
HIDDEN_NODE_RATIO	Microsoft Neural Network Algorithm	入力ニューロンおよび出力ニューロンに対する非表示ニューロンの比率を指定します。次の式で、非表示層のニューロンの最初の数を求めます。 HIDDEN_NODE_RATIO * SQRT (入力ニューロンの総数 * 出力ニューロンの総数) 既定値は、4.0 です。
HISTORIC_MODEL_COUNT	Microsoft Time Series アルゴリズム	作成する履歴モデルの数を指定します。既定値は 1 です。
HISTORICAL_MODEL_GAP	Microsoft Time Series アルゴリズム	2 つの連続した履歴モデル間のタイムラグを指定します。たとえば、この値を g に設定すると、g、2g、3g などの間隔でタイムスライスによって切り捨てられるデータに対して履歴モデルが作成されます。既定値は 10 です。
HOLDOUT_PERCENTAGE	Microsoft ロジスティック回帰アルゴリズム Microsoft Neural Network Algorithm	提示されたエラーの計算に使用するトレーニングデータ内のケースの割合を指定します。この割合は、マイニングモデルのトレーニング中に停止条件の一部として使用されます。既定値は 30 です。注: このパラメーターは、マイニング構造に適用される提示データ割合値とは異なります。
HOLDOUT_SEED	Microsoft ロジスティック回帰アルゴリズム Microsoft Neural Network Algorithm	アルゴリズムが予約データをランダムに調べるときに使用する擬似乱数ジェネレーターのシード値を指定します。このパラメーターを 0 に設定すると、アルゴリズムによってマイニングモデルの名前に基づいたシードが生成され、再処理中にモデルのコンテンツが変更されることはありません。既定値は 0 です。注: このパラメーターは、マイニング構造に適用される提示データのシード値とは異なります。
INSTABILITY_SENSITIVITY	Microsoft Time Series アルゴリズム	予測の分散が一定のしきい値を超え、ARTxp アルゴリズムで予測が非表示化されるポイントを制御します。既定値は 1 です。注: このパラメーターは、ARTxp アルゴリズムを使用する混合モデルまたはモデルにのみ適用されます。
MAXIMUM_INPUT_ATTRIBUTES	Microsoft クラスタリングアルゴリズム Microsoft デシジョンツリーアルゴリズム Microsoft 線形回帰アルゴリズム Microsoft Naïve Bayes アルゴリズム Microsoft Neural Network Algorithm Microsoft ロジスティック回帰アルゴリズム	選択した機能を呼び出す前にアルゴリズムが処理できる入力属性の数を定義します。この値を 0 に設定すると、機能の選択がオフになります。既定値は 255 です。
MAXIMUM_ITEMSET_COUNT	Microsoft アソシエーションアルゴリズム	生成されるアイテムセットの最大数を指定します。数が指定されていない場合、アルゴリズムは生成可能なアイテムセットをすべて生成します。既定値は 200000 です。
MAXIMUM_ITEMSET_SIZE	Microsoft アソシエーションアルゴリズム	アイテムセットで使用できるアイテムの最大数を指定します。この値を 0 に設定すると、アイテムセットのサイズに制限がなくなります。既定値は 3 です。
MAXIMUM_OUTPUT_ATTRIBUTES	Microsoft デシジョンツリーアルゴリズム Microsoft 線形回帰アルゴリズム Microsoft ロジスティック回帰アルゴリズム Microsoft Naïve Bayes アルゴリズム Microsoft Neural Network Algorithm	選択した機能を呼び出す前にアルゴリズムが処理できる出力属性の数を定義します。この値を 0 に設定すると、機能の選択がオフになります。既定値は 255 です。
MAXIMUM_SEQUENCE_STATES	「Microsoft シーケンスクラスターアルゴリズム」	シーケンスの状態の最大数を指定します。この値を 100 より大きい数値に設定すると、アルゴリズムは意味のある情報を提供するモデルを作成できなくなります。既定値は、64 です。
MAXIMUM_SERIES_VALUE	Microsoft Time Series アルゴリズム	予測に使用する最大値を指定します。このパラメーターを MINIMUM_SERIES_VALUE と共に使用すると、予測が所定の範囲内に制約されます。たとえば、日次の予測販売数量が製品の在庫数を超えないように指定することができます。
MAXIMUM_STATES	Microsoft クラスタリングアルゴリズム Microsoft Neural Network Algorithm 「Microsoft シーケンスクラスターアルゴリズム」	アルゴリズムによってサポートされる属性状態の最大数を指定します。属性に含まれる状態の数が状態の最大数を超える場合、アルゴリズムは属性の最も一般的な状態を使用し、残りの状態を無視します。既定値は 100 です。
MAXIMUM_SUPPORT	Microsoft アソシエーションアルゴリズム	アイテムセットがサポートされるケースの最大数を指定します。この値が 1 より小さい場合、値はケースの総数の割合を表します。この値が 1 より大きい場合、アイテムセットを含めることができるケースの絶対数を表します。既定値は 1 です。
MINIMUM_IMPORTANCE	Microsoft アソシエーションアルゴリズム	アソシエーションルールの重要度のしきい値を指定します。重要度がこの値より低いルールは除外されます。
MINIMUM_ITEMSET_SIZE	Microsoft アソシエーションアルゴリズム	アイテムセットで使用できるアイテムの最小数を指定します。既定値は 1 です。
MINIMUM_DEPENDENCY_PROBABILITY	Microsoft Naïve Bayes アルゴリズム	入力属性と出力属性間の依存関係の最小確率を指定します。この値は、アルゴリズムによって生成されるコンテンツのサイズを制限するために使用されます。このプロパティは 0 ～ 1 の範囲で設定できます。値を大きくすると、モデルのコンテンツの属性数が減ります。既定値は 0.5 です。
MINIMUM_PROBABILITY	Microsoft アソシエーションアルゴリズム	ルールが true である最小確率を指定します。たとえば、この値を 0.5 に設定すると、確率が 50% 未満のルールは生成されません。既定値は 0.4 です。
MINIMUM_SERIES_VALUE	Microsoft Time Series アルゴリズム	時系列予測に対する下限の制約を指定します。予測値がこの制約を下回ることはありません。
MINIMUM_SUPPORT	Microsoft アソシエーションアルゴリズム	アルゴリズムによってルールが生成される前に、アイテムセットを含む必要があるケースの最小数を指定します。この値を 1 より小さい値に設定すると、ケースの最小数がケースの総数の割合として指定されます。この値を 1 より大きい整数に設定すると、ケースの最小数がアイテムセットを含む必要のあるケースの絶対数として指定されます。メモリに制限がある場合は、アルゴリズムによってこのパラメーターが大きな値に設定されることがあります。既定値は 0.03 です。
MINIMUM_SUPPORT	Microsoft クラスタリングアルゴリズム	各クラスターのケースの最小数を指定します。既定値は 1 です。
MINIMUM_SUPPORT	Microsoft デシジョンツリーアルゴリズム	デシジョンツリー内で分割を生成するために必要なリーフケースの最小数を決定します。既定値は 10 です。
MINIMUM_SUPPORT	「Microsoft シーケンスクラスターアルゴリズム」	各クラスターのケースの最小数を指定します。既定値は 10 です。
MINIMUM_SUPPORT	Microsoft Time Series アルゴリズム	各タイムシリーズツリーで分割を生成するために必要なタイムスライスの最小数を指定します。既定値は 10 です。
MISSING_VALUE_SUBSTITUTION	Microsoft Time Series アルゴリズム	履歴データのギャップを埋めるために使用する方法を指定します。既定では、データに不規則なギャップや不揃いな境界があることは許されません。不規則なギャップや境界を埋めるには、以前の値、平均値、または特定の数値定数を使用します。
MODELLING_CARDINALITY	Microsoft クラスタリングアルゴリズム	クラスタリング処理中に作成されるサンプルモデルの数を指定します。既定値は 10 です。
PERIODICITY_HINT	Microsoft Time Series アルゴリズム	データの周期性に関して、アルゴリズムにヒントを提供します。たとえば、売上が年ごとに異なり、シリーズの単位が月である場合、周期性は 12 です。このパラメーターの形式は {n [, n]} です。ここで、n には正の値を指定します。角かっこ ([]) 内の n は省略可能で、必要なだけ繰り返すことができます。既定では、 {1}です。
PREDICTION_SMOOTHING	Microsoft Time Series アルゴリズム	ARTxp および ARIMA タイムシリーズアルゴリズムの組み合わせを制御します。指定した値は、FORECAST_METHOD パラメーターが MIXED に設定されている場合にのみ有効となります。値は 0 から 1 までの範囲で指定する必要があります。値が 0 の場合は、ARTxp のみがモデルで使用されます。値が 1 の場合は、ARIMA のみがモデルで使用されます。値が 0 に近づくほど、ARTxp が使用される割合が高くなります。値が 1 に近づくほど、ARIMA が使用される割合が高くなります。
SAMPLE_SIZE	Microsoft クラスタリングアルゴリズム	CLUSTERING_METHOD パラメーターをスケーラブルなクラスタリング手法のいずれかに設定する場合に、アルゴリズムにより各パスで使用されるケースの数を指定します。 SAMPLE_SIZE パラメーターを 0 に設定すると、データセット全体が単一のパスでクラスター化されます。この場合、メモリとパフォーマンスに関する問題が生じる可能性があります。既定値は 50000 です。
SAMPLE_SIZE	Microsoft ロジスティック回帰アルゴリズム Microsoft Neural Network Algorithm	モデルのトレーニングに使用するケースの数を指定します。アルゴリズムプロバイダーでは、この数と、HOLDOUT_PERCENTAGE パラメーターで指定された割合に含まれないケースの総数の割合のうち、いずれか小さい方が使用されます。たとえば、HOLDOUT_PERCENTAGE が 30 に設定されている場合、アルゴリズムでは、このパラメーターの値と、ケースの総数の 70% に相当する値のうち、いずれか小さい方が使用されます。既定値は 10000 です。
SCORE_METHOD	Microsoft デシジョンツリーアルゴリズム	分割スコアを計算するために使用する方法を決定します。指定可能なオプションは、(1) エントロピ、(2) K2 事前分布を指定したベイズ定理、(3) 均一な事前分布を指定したベイズディリクレ等式 (BDE) です。既定値は 3 です。
SPLIT_METHOD	Microsoft デシジョンツリーアルゴリズム	ノードを分割するために使用する方法を決定します。指定可能なオプションは、バイナリ (1)、完全 (2)、または両方 (3) です。既定値は 3 です。
STOPPING_TOLERANCE	Microsoft クラスタリングアルゴリズムテクニカルリファレンス	収束に到達し、アルゴリズムによるモデルの作成が完了する時点を決定するための値を指定します。収束に到達するのは、クラスターの確率の全体的な変化が、モデルのサイズで除算された STOPPING_TOLERANCE パラメーターの比率に満たないときです。既定値は 10 です。

説明

アルゴリズムの詳細については、SQL Server オンラインブックを参照してください。

参照

データマイニングアルゴリズム (SQL Server データマイニングアドイン)

次の方法で共有

アルゴリズムパラメーター (SQL Server データマイニングアドイン)

アルゴリズムパラメーターの一覧

説明

参照

その他のリソース

次の方法で共有

アルゴリズム パラメーター (SQL Server データ マイニング アドイン)

アルゴリズム パラメーターの一覧

説明

参照

その他のリソース

アルゴリズムパラメーター (SQL Server データマイニングアドイン)

アルゴリズムパラメーターの一覧