論理アーキテクチャ (Analysis Services - データマイニング)

[アーティクル]
04/27/2017

データマイニングは、複数のコンポーネントの相互作用を伴うプロセスです。

SQL Server データベース内のデータのソースまたはその他のデータソースにアクセスし、トレーニング、テスト、または予測に使用します。
データマイニング構造とモデルは、SQL Server Data Tools (SSDT) または Visual Studio を使用して定義します。
データマイニングオブジェクトを管理し、SQL Server Management Studioを使用して予測とクエリを作成します。
ソリューションが完成したら、Analysis Services のインスタンスにそのソリューションを配置します。

これらのソリューションオブジェクトを作成するプロセスについては、既に他の場所で説明しています。詳細については、「データマイニングソリューション」を参照してください。

データマイニングソースデータ

データマイニングで使用するデータは、データマイニングソリューションに格納されません。バインドのみが格納されます。データは前のバージョンの SQL Server、CRM システム、またはフラットファイルで作成されたデータベースにも存在する場合があります。処理によって構造またはモデルをトレーニングすると、データの統計サマリーが作成され、キャッシュに格納されます。そのサマリーは、後の操作で使用するために保持することも、処理後に削除することもできます。詳細については、「マイニング構造 (Analysis Services - データマイニング)」を参照してください。

Analysis Services データソースビュー (DSV) オブジェクト内で異なるデータを結合します。これは、データソースの上に抽象化レイヤーを提供します。テーブル間の結合を指定できます。また、多対一のリレーションシップを持つテーブルを追加して、入れ子になったテーブル列を作成することができます。これらのオブジェクト (データソースおよびデータソースビュー) の定義は、*.ds および *.dsv というファイル名拡張子でソリューション内に保存されます。 Analysis Services データソースとデータソースビューの作成と使用の詳細については、「サポートされているデータソース (SSAS 多次元)」を参照してください。

AMO または XMLA を使用して、データソースおよびデータソースビューを定義および変更することもできます。これらのオブジェクトをプログラムで操作する方法の詳細については、「論理アーキテクチャの概要 (Analysis Services - 多次元データ)」を参照してください。

マイニング構造

データマイニング構造は、マイニングモデルの作成元のデータドメインを定義する論理データコンテナーです。 1 つのマイニング構造で複数のマイニングモデルをサポートできます。

データマイニングソリューションでデータを使用する必要がある場合、Analysis Services ではソースからデータを読み込み、集計およびその他の情報のキャッシュを生成します。既定では、トレーニングデータを再利用して追加のモデルをサポートできるように、このキャッシュは保持されます。キャッシュを削除する必要がある場合は、マイニング構造オブジェクトの CacheMode プロパティを値 ClearAfterProcessing に変更します。詳細については、「 AMO データマイニングクラス」を参照してください。

SQL Server 2014 Analysis Services (SSAS) では、データをトレーニングデータセットとテストデータセットに分離して、代表的なランダムに選択されたデータセットでマイニングモデルをテストすることもできます。データは、実際には別々に格納されません。構造キャッシュ内のケースデータには、その特定のケースがトレーニングに使用されるかテストに使用されるかを示すプロパティが設定されます。キャッシュを削除すると、その情報を取得できなくなります。

詳細については、「マイニング構造 (Analysis Services - データマイニング)」を参照してください。

データマイニング構造には、入れ子になったテーブルを含めることができます。入れ子になったテーブルは、プライマリデータテーブルでモデル化されているケースに関する追加の詳細情報を提供します。詳細については、「入れ子になったテーブル (Analysis Services - データマイニング)」を参照してください。

[マイニングモデル]

処理前のデータマイニングモデルは、メタデータのプロパティの組み合わせにすぎません。これらのプロパティでは、マイニング構造とデータマイニングアルゴリズムを指定し、データの処理方法に影響するパラメーターとフィルター設定のコレクションを定義します。詳細については、「マイニングモデル (Analysis Services - データマイニング)」を参照してください。

モデルを処理すると、マイニング構造のキャッシュに格納されたトレーニングデータを使用して、データの統計プロパティと、アルゴリズムおよびそのパラメーターによって定義されたヒューリスティックの両方に基づいたパターンが生成されます。これは、モデルの トレーニング と呼ばれます。

トレーニングの結果は、見つかったパターンを表し、予測を生成するルールを提供する一連の概要データで、 モデルコンテンツに格納されます。詳細については、「マイニングモデルコンテンツ (Analysis Services - データマイニング)」を参照してください。

限られた状況では、標準形式である Predictive Model Markup Language (PMML) に従ってモデルの数式とデータバインドを表すファイルにモデルの論理構造をエクスポートすることもできます。 PMML を使用する他のシステムにこの論理構造をインポートし、そのモデルを予測に使用することができます。詳細については、「 DMX 選択ステートメントについて」を参照してください。

カスタムデータマイニングオブジェクト

精度チャート、予測クエリなど、データマイニングプロジェクトのコンテキストで使用するその他のオブジェクトは、ソリューション内に保存されませんが、ASSL を使用してスクリプト化することや、AMO を使用して作成することができます。

さらに、Analysis Services のインスタンスで使用できるサービスと機能を拡張するには、次のカスタムオブジェクトを追加します。

カスタムアセンブリ
.NET アセンブリは、CLR または COM に準拠した任意の言語を使用して定義した後、SQL Server のインスタンスに登録できます。アセンブリファイルは、アプリケーションで定義された場所から読み込まれ、コピーは、データと共にサーバーに保存されます。アセンブリファイルのコピーは、サービスが開始されるたびにアセンブリを読み込むために使用されます。

詳細については、「多次元モデルのアセンブリの管理」を参照してください。

カスタムストアドプロシージャ
Analysis Services データマイニングでは、ストアドプロシージャを使用してデータマイニングオブジェクトを操作できます。独自のストアドプロシージャを作成して、機能を拡張し、予測クエリおよびコンテンツクエリから返されるデータをより簡単に操作できます。

ストアドプロシージャの定義

次のストアドプロシージャを使用して、クロス検証を実行できます。

データマイニングのストアドプロシージャ (Analysis Services - データマイニング)

さらに、Analysis Services には、データマイニングに内部的に使用される多くのシステムストアドプロシージャが含まれています。システムストアドプロシージャは内部で使用するためのものですが、それらを応用することもできます。これらのストアドプロシージャは、マイクロソフトによって随時変更される場合があります。そのため、実際の運用では、DMX、AMO、または XMLA を使用してクエリを作成することをお勧めします。

カスタムプラグインアルゴリズム
Analysis Services には、独自のアルゴリズムを作成し、そのアルゴリズムを新しいデータマイニングサービスとしてサーバーインスタンスに追加するためのメカニズムが用意されています。

Analysis Services では、COM インターフェイスを使用して、プラグインアルゴリズムと通信します。新しいアルゴリズムの実装方法の詳細については、「プラグインアルゴリズム」を参照してください。

新しいアルゴリズムはそれぞれ使用する前に登録する必要があります。アルゴリズムを登録するには、Analysis Services のインスタンスの.ini ファイルにアルゴリズムに必要なメタデータを追加します。新しいアルゴリズムを使用する各インスタンスに情報を追加する必要があります。アルゴリズムを追加したら、インスタンスを再起動し、MINING_SERVICES スキーマ行セットを使用して、新しいアルゴリズムを表示し、そのアルゴリズムでサポートされているオプション、プロバイダーなどを確認できます。

参照

多次元モデルのオブジェクト処理
 データマイニング拡張機能 (DMX) リファレンス

次の方法で共有

論理アーキテクチャ (Analysis Services - データマイニング)

データマイニングソースデータ

マイニング構造

[マイニングモデル]

カスタムデータマイニングオブジェクト

参照

その他のリソース

次の方法で共有

論理アーキテクチャ (Analysis Services - データ マイニング)

データ マイニング ソース データ

マイニング構造

[マイニング モデル]

カスタム データ マイニング オブジェクト

参照

その他のリソース

論理アーキテクチャ (Analysis Services - データマイニング)

データマイニングソースデータ

[マイニングモデル]

カスタムデータマイニングオブジェクト