次の方法で共有


データ マイニング ウィザード (Analysis Services - データ マイニング)

適用対象:SQL Server 2019 以前の Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

データ マイニングは SQL Server 2017 Analysis Services で非推奨となり、SQL Server 2022 Analysis Services で停止されました。 非推奨および停止された機能については、ドキュメントの更新は行われません。 詳細については、「Analysis Services 下位互換性」を参照してください。

Microsoft SQL Server SQL Server Analysis Servicesのデータ マイニング ウィザードは、新しいマイニング構造をデータ マイニング プロジェクトに追加するたびに開始されます。 このウィザードでは、データ ソースを選択し、分析に使用されるデータを定義するデータ ソース ビューをセットアップできます。さらに、初期モデルを作成できます。

ウィザードの最後のフェーズでは、オプションでデータをトレーニング セットとテスト セットに分けることができ、ドリルスルーなどの機能を有効にすることができます。

開始する前の確認事項

ウィザードを開始する前に、次のことを確認しておく必要があります。

  • データ マイニング構造およびモデルを、リレーショナル データベースから作成するか、OLAP データベースの既存のキューブから作成するか。

  • ケース レコードを一意に識別するキーは、どの列に含まれているか。

  • どの列または属性を予測に使用するか。 どの列または属性を分析の入力として使用するのが適しているか。

  • どのアルゴリズムを使用するのがよいか。 SQL Server SQL Server Analysis Servicesで提供されるアルゴリズムはすべて異なる特性を持ち、異なる結果を生成します。 データの各セット用のモデルは 1 つに限られていないので、さまざまなモデルを追加して試してみることができます。

  • 統合されたデータ セットでモデルをテストできる必要があるか。 その場合は、テストのためにデータを確保しておくオプションの使用を検討してください。 割合を選択して、必要であれば、指定した行数で上限を設定できます。

データ マイニング ウィザードの開始

データ マイニング ウィザードを使用するには、少なくとも 1 つのデータ マイニングまたは OLAP プロジェクトを含むソリューションをSQL Server Data Toolsで開いている必要があります。

  • ソリューションでデータ マイニングの準備ができている場合は、ソリューション エクスプローラーで [マイニング構造] ノードを右クリックし、 [新しいマイニング構造] を選択すると、ウィザードが開始されます。

  • ソリューションに既存のプロジェクトが含まれていない場合は、新しいデータ マイニング プロジェクトを追加できます。 [ファイル] メニューの [新規作成] を選択し、[プロジェクト] を選択します。 必ず [Analysis Services 多次元およびデータ マイニング プロジェクト]テンプレートを選択してください。

  • 既存のデータ マイニング ソリューションからメタデータを取得するために、Analysis Services インポート ウィザードを使用することもできます。 ただし、インポートする個々のオブジェクトを選択することはできません。すべてのキューブ、データ ソース ビューなどを含む、データベース全体がインポートされます。また、インポートを通じて作成される新しいソリューションは、ローカルの既定のデータベースを使用するように自動的に構成されることにも注意してください。 オブジェクトを処理または参照する前に、これを別のインスタンスに変更する必要がある場合があり、以前のバージョンのSQL Server Analysis Servicesからインポートする場合は、プロバイダーへの参照を更新する必要がある場合があります。

次に、マイニング構造と、1 つの関連するデータ マイニング モデルを作成します。 マイニング構造だけを作成して、モデルは後で追加することもできますが、一般的にはテスト モデルを先に作成しておく方が簡単です。

リレーショナル データ ソースとOLAP マイニング モデル

次の重要な選択は、リレーショナル データ ソースを使用するか、モデルのベースを多次元 (OLAP) データにするかです。

ここで、データ マイニング ウィザードは、使用するデータ ソースがリレーショナルかキューブ内にあるかに応じて、2 つのパスに分岐します。 データ選択プロセス以外は、アルゴリズムの選択、ホールドアウト データ セットの追加機能などと同じですが、キューブ データの選択は、リレーショナル データを使用するよりも少し複雑です。 また、キューブに基づくモデルを作成する場合は、最後にいくつかの追加のオプションも提示されます。

各オプションの詳細のチュートリアルについては、以下のトピックを参照してください。

Create a Relational Mining Structure
リレーショナル データ マイニング モデルを作成する場合の判断について説明します。

Create an OLAP Mining Structure
OLAP キューブのデータを使用する場合の追加のオプションと選択について説明します。

注意

データ マイニングを行うためにキューブまたは OLAP データベースは必要ありません。 データがキューブに格納されていない限り、あるいはマイニングの対象が OLAP ディメンションまたは OLAP 集計や OLAP 計算の結果でない限り、データ マイニングにはリレーショナル テーブルまたはデータ ソースを使用することをお勧めします。

アルゴリズムの選択

次に、データの処理に使用するアルゴリズムを決定する必要があります。 この決定は、難しい場合があります。 SQL Server Analysis Servicesで提供される各アルゴリズムには異なる機能があり、異なる結果が生成されるため、データとビジネス上の問題に最も適したモデルを決定する前に、いくつかの異なるモデルを試して試すことができます。 各アルゴリズムに最適なタスクの説明については、以下のトピックを参照してください。

データ マイニング アルゴリズム (Analysis Services - データ マイニング)

前に述べたように、異なるアルゴリズムを使用して複数のモデルを作成したり、アルゴリズムのパラメーターを変更して異なるモデルを作成したりできます。 選択したアルゴリズムだけにこだわらず、同じデータで複数の異なるモデルを作成してみることをお勧めします。

モデリングに使用するデータの定義

ソースからデータを選択するだけでなく、データ ソース ビュー内のどのテーブルに ケース データが含まれているかを指定する必要もあります。 ケース テーブルは、データ マイニング モデルのトレーニングに使用されます。そのため、分析するエンティティ (たとえば顧客とその人口統計情報) が格納されている必要があります。 各ケースは一意であり、 ケース キーによって識別できる必要があります。

ケース テーブルを指定するだけでなく、 入れ子になったテーブル をデータに含めることもできます。 通常、入れ子になったテーブルには、ケース テーブル内のエンティティに関する追加情報 (たとえば顧客によって行われた取引) や、エンティティと多対一の関係を持つ属性が格納されます。 たとえば、 Customers ケース テーブルに結合されている入れ子になったテーブルには、各顧客によって購入された製品のリストが含まれています。 Web サイトへのトラフィックを分析するモデルでは、入れ子になったテーブルに、ユーザーが閲覧した一連のページが含まれるものと思われます。 詳細については、「入れ子になったテーブル (Analysis Services - データ マイニング)」を参照してください。

追加機能

適切なデータの選択や正しいデータ ソースの構成を補助するために、データ マイニング ウィザードには次の追加機能が用意されています。

  • データ型の自動検出: ウィザードは列値の一意性と分布を調べ、最適なデータ型を推奨して、データの使用法の種類を提示します。 これらの提示は、一覧から値を選択してオーバーライドできます。

  • 変数の提示: ダイアログ ボックス上でのクリック操作で、アナライザーを開始できます。アナライザーは、モデルに含まれている列全体の相関関係を計算し、これまでのモデルの構成に基づいて、いずれかの列が結果属性の予測子となり得るかを判断します。 これらの提示は、別の値を入力してオーバーライドできます。

  • 機能選択: 多くのアルゴリズムでは、適切な予測子である列が自動的に検出され、それらが優先的に使用されます。 あまりに多くの値を持つ列では、 機能選択 が適用され、データのカーディナリティが引き下げられて、意味のあるパターンを発見できる可能性が高められます。 機能選択の動作は、モデルのパラメーターを使用して調整できます。

  • 自動キューブ スライス: マイニング モデルが OLAP データ ソースに基づいている場合は、キューブ属性を使用してモデルをスライスする機能が自動的に提供されます。 これは、キューブ データのサブセットに基づくモデルの作成に便利です。

ウィザードの完了

ウィザードでの最後の手順として、マイニング構造と関連マイニング モデルに名前を付けます。 作成したモデルの種類に応じて、次の重要なオプションも提示される場合があります。

  • [ドリルスルーを許可する]を選択すると、 ドリルスルー 機能がモデルで有効になります。 ドリルスルーを使用すると、適切な権限を持つユーザーが、モデルの作成に使用するソース データを調査できるようになります。

  • OLAP モデルを作成している場合は、 [新しいデータ マイニング キューブの作成]または [データ マイニング ディメンションの作成]オプションを選択できます。 どちらのオプションも、完成したモデルの参照と、基になるデータへのドリルスルーを容易にします。

データ マイニング ウィザードを完了したら、データ マイニング デザイナーを使用してマイニング構造およびモデルを変更し、モデルの精度の表示、構造およびモデルの特性の表示、またはモデルを使用した予測の作成を行います。

ページのトップへ

データ マイニング モデルの作成時に決定する必要がある事項の詳細については、次のリンクを参照してください。

データ マイニング アルゴリズム (Analysis Services - データ マイニング)

コンテンツの種類 (データ マイニング)

データ型 (データ マイニング)

機能の選択 (データ マイニング)

不足値 (Analysis Services - データ マイニング)

マイニング モデルでのドリルスルー

参照

データ マイニング ツール
データ マイニング ソリューション