テスト セットの作成 (データ マイニング ウィザード)
[テスト セットの作成] ページを使用すると、トレーニングに使用するデータの量、およびテスト セットとして使用するために予約するデータの量を指定できます。 マイニング構造を作成する際にデータをトレーニングとテストのセットに分割すると、後で作成するマイニング モデルの精度をより簡単に評価できるようになります。
テスト データの量を割合で指定することも、テストに使用するケースの数を制限する数値を指定することもできます。 テストに使用するケースの最大数と割合の両方を指定すると、両方の設定が使用され、テスト データセットには小さい方の数のケースが含められます。 既定では、データの 30% がテストに、70% がトレーニングに使用され、テスト ケースの最大数はありません。
既定では、Analysis Services はパーティション分割を開始するために使用される数値シードを生成します。 このシードはマイニング構造の名前に基づきます。 マイニング構造の名前を変更してもパーティションが変わらないようにするには、マイニング構造の HoldoutSeed プロパティを設定してシードの値を指定します。 提示されたシードを変更する場合は、構造を再処理する必要があります。
後でテストまたはトレーニング データの量を変更する場合は、Properties ウィンドウを使用して、データ マイニング構造のHoldoutMaxCases
プロパティとHoldoutMaxPercent
プロパティを変更できます。 ただし、変更を行った後、マイニング構造および関連するすべてのマイニング モデルを再処理する必要があります。 また、次の制限事項が適用されます。
データ マイニング構造のパーティション分割は、データ マイニング構造が SQL Server 2008 に格納されている場合にのみサポートされます。 以前のバージョンの SQL Server Analysis Services では、マイニング構造のパーティション情報のキャッシュはサポートされていません。
タイム シリーズ マイニング モデルに必要な Key Time 列がマイニング構造に含まれている場合、そのマイニング構造をパーティション分割することはできません。
入れ子になったテーブルに格納されている値を予測しようとしている場合、データをパーティション分割することはできません。
詳細: Testing and Validation (データ マイニング)、 リレーショナル マイニング構造の作成、 Basic データ マイニング チュートリアル
[オプション]
テスト用のデータの割合
トレーニング セットとして使用するデータの割合を増減するには、上矢印および下矢印をクリックするか、テキスト ボックスに 0 ~ 100 の値を入力します。
データ・セットのテスト中のケースの最大数
テストに使用できるケースの数を制限する数値を入力します。
データの実際のケース数よりも大きな数値を指定すると、すべてのケースが使用されます。
の既定値は NULL です。 これは制限がないことを示します。
参照
データ マイニング ウィザードの F1 ヘルプ (Analysis Services - データ マイニング)
[関連列の提示] (データ マイニング ウィザード)
[テーブルの種類の指定] (データ マイニング ウィザード)
[列のコンテンツおよびデータ型の変更] (データ マイニング ウィザード)