次の方法で共有


テスト セットの作成 (データ マイニング ウィザード)

[テスト セットの作成] ページを使用すると、トレーニングに使用するデータの量、およびテスト セットとして使用するために予約するデータの量を指定できます。マイニング構造を作成する際にデータをトレーニングとテストのセットに分割すると、後で作成するマイニング モデルの精度をより簡単に評価できるようになります。

テスト データの量を割合で指定することも、テストに使用するケースの数を制限する数値を指定することもできます。テストに使用するケースの最大数と割合の両方を指定すると、両方の設定が使用され、テスト データセットには小さい方の数のケースが含められます。既定では、データの 30% がテストに、70% がトレーニングに使用され、テスト ケースの最大数はありません。

既定では、Analysis Services で、パーティション分割の開始に使用される数値シードが生成されます。このシードはマイニング構造の名前に基づきます。マイニング構造の名前を変更してもパーティションが変わらないようにするには、マイニング構造の HoldoutSeed プロパティを設定してシードの値を指定します。提示されたシードを変更する場合は、構造を再処理する必要があります。

テスト データまたはトレーニング データの量を後で変更するには、[プロパティ] ウィンドウを使用して、データ マイニング構造の HoldoutMaxCases プロパティおよび HoldoutMaxPercent プロパティを変更します。ただし、変更を行った後、マイニング構造および関連するすべてのマイニング モデルを再処理する必要があります。また、次の制限事項が適用されます。

  • データ マイニング構造のパーティション分割は、そのデータ マイニング構造が SQL Server 2008 に格納されている場合にのみサポートされます。以前のバージョンの SQL Server Analysis Services では、マイニング構造のパーティション情報のキャッシュはサポートされません。

  • タイム シリーズ マイニング モデルに必要な Key Time 列がマイニング構造に含まれている場合、そのマイニング構造をパーティション分割することはできません。

  • 入れ子になったテーブルに格納されている値を予測しようとしている場合、データをパーティション分割することはできません。

詳細情報 :データ マイニング モデルの検証 (Analysis Services - データ マイニング)」、「新しいマイニング構造の作成」、「基本的なデータ マイニング チュートリアル

オプション

  • [テスト用データの割合]
    トレーニング セットとして使用するデータの割合を増減するには、上矢印および下矢印をクリックするか、テキスト ボックスに 0 ~ 100 の値を入力します。

  • [テスト データセット内のケースの最大数]
    テストに使用できるケースの数を制限する数値を入力します。

    データの実際のケース数よりも大きな数値を指定すると、すべてのケースが使用されます。

    既定値は NULL です。これは制限がないことを示します。