データマイニングでの Integration Services の使用

[アーティクル]
12/15/2008

新規 : 2006 年 4 月 14 日

データマイニングとは、"大規模なデータベースから有効で実用的な情報を抽出するプロセスである" と表現されるのが一般的です。つまり、データマイニングは、データに内在するパターンおよび傾向を検出するのに役立ちます。Microsoft SQL Server 2005 Analysis Services には、これらのパターンを抽出および分析するための強力なデータマイニング用の機能とツールが備えられています。Integration Services には、これらのデータマイニングモデルの管理や照会を支援するさまざまなコンポーネントが用意されています。

SQL Server 2005 Analysis Services (SSAS) のデータマイニング機能の詳細については、「データマイニングの概念」および「データマイニングの操作」を参照してください。

メモ :
このトピックで説明する Integration Services のコンポーネントの一部は、SQL Server 2005 の Enterprise Edition および Developer Edition でのみ使用できます。

接続マネージャ

接続マネージャとは、データソースへの接続を論理的に表したものです。Analysis Services 接続マネージャを使用すると、マイニング構造およびマイニングモデルが格納された Analysis Services データベースに接続できます。このトピックで説明するすべてのタスクとデータフローコンポーネントには、Analysis Services 接続マネージャが必要です。

Analysis Services 接続マネージャ

Analysis Services 接続マネージャを使用すると、パッケージから、Analysis Services データベースを実行するサーバー、またはマイニング構造やマイニングモデルにアクセスできる Analysis Services プロジェクトに接続できます。Business Intelligence Development Studio でのパッケージ開発中に接続できるのは、Analysis Services プロジェクトのみです。実行時には、パッケージは Analysis Services を配置したサーバーおよびデータベースに接続されます。

詳細については、「Analysis Services 接続マネージャ」を参照してください。

タスク

タスクとは、パッケージで実行される作業の単位を定義する、制御フローの要素のことです。以下のタスクを使用して、データマイニングの構造やモデルの作成または変更、およびモデルの処理またはクエリを行うことができます。

Analysis Services DDL 実行タスク

Analysis Services DDL 実行タスクは、データ定義言語 (DDL) ステートメントを実行します。DDL ステートメントを使用すると、マイニング構造やマイニングモデルを作成、削除、または変更できます。DDL ステートメントは、Analysis Services スクリプト言語 (ASSL) のステートメントとして表され、XML for Analysis (XMLA) コマンドで構成されます。

このタスクの詳細については、「Analysis Services DDL 実行タスク」を参照してください。XMLA を使用した Analysis Services オブジェクトの作成および変更の詳細については、「オブジェクトの作成と変更 (XMLA)」を参照してください。

Analysis Services 処理タスク

Analysis Services 処理タスクは、マイニングモデルなどの Analysis Services オブジェクトの処理を自動化します。

このタスクの詳細については、「Analysis Services 処理タスク」を参照してください。Analysis Services オブジェクトの処理の詳細については、「Analysis Services での処理」を参照してください。

データマイニングクエリタスク

データマイニングクエリタスクは、Analysis Services に構築されたデータマイニングモデルに基づいて、予測クエリを実行します。予測クエリは、マイニングモデルを使用して新しいデータの予測を作成し、その出力をテーブルに保存します。

このタスクの詳細については、「データマイニングクエリタスク」を参照してください。DMX を使用したデータマイニングモデルのクエリの詳細については、「DMX 予測クエリの作成」を参照してください。

データフロー変換

変換とは、パッケージのデータフロー内にある、データを集計、マージ、配信、および変更するコンポーネントのことです。

データマイニングクエリ変換

データマイニングクエリ変換は、データマイニングモデルに対して予測クエリを実行します。この変換には、データマイニング拡張機能 (DMX) クエリを作成するためのクエリビルダが含まれています。このクエリビルダを使用すると、DMX 言語を使用して、既存のマイニングモデルに対して変換入力データを評価するカスタムステートメントを作成できます。出力を直接テーブルに保存するデータマイニングクエリタスクとは異なり、データマイニングクエリ変換では、パッケージのデータフローの下流コンポーネントで出力を使用できます。

この変換の詳細については、「データマイニングクエリ変換」を参照してください。DMX を使用したデータマイニングモデルのクエリの詳細については、「DMX 予測クエリの作成」を参照してください。

データフローの変換先

変換先とは、データフローの出力を別の種類のデータソースに読み込んだり、メモリ内のデータセットを作成する、データフローコンポーネントのことです。

データマイニングモデルトレーニング変換先

データマイニングモデルトレーニング変換先は、変換先が受け取るデータをデータマイニングモデルアルゴリズムに渡すことにより、データマイニングモデルのトレーニングを行います。トレーニング処理の間、アルゴリズムに基づいてデータの要素間のパターンおよびリレーションシップが計算されます。新しいマイニングモデルのトレーニングが完了したら、そのモデルを使用して予測クエリを実行できます。

詳細については、「データマイニングモデルトレーニング変換先」を参照してください。

データマイニングのためのその他の Integration Services コンポーネント

Integration Services には、他にもデータマイニングソリューションの一部として使用できる便利なコンポーネントが多数あります。

データのサブセットを使用してデータマイニングモデルをトレーニングまたはテストするには、次の変換を使用できます。
- **行サンプリング変換 **指定された数に基づいて、行のサブセットのみをコピーします。詳細については、「行サンプリング変換」を参照してください。
- **比率サンプリング変換 **指定された比率に基づいて、行のサブセットのみをコピーします。詳細については、「比率サンプリング変換」を参照してください。
重複の削除および値の標準化によりデータを最適化するには、次の変換を使用できます。
- **並べ替え変換 **データの並べ替え時に重複行を削除します。詳細については、「並べ替え変換」を参照してください。
- **あいまいグループ化変換 **完全一致ではなく類似性に基づいて行をグループ化します。詳細については、「あいまいグループ化変換」および「あいまいグループ化変換を使用して、類似のデータ行を識別する方法」を参照してください。
- **あいまい参照変換 **完全一致ではなく類似性に基づいて参照テーブル内の一致を検出します。詳細については、「あいまい参照変換」を参照してください。
テキストマイニングを実行するには、次の変換を使用できます。
- **用語抽出変換 **標準およびユーザー定義のノイズワードをフィルタにより除外した後で、変換元で検出された用語のテーブルを作成します。詳細については、「用語抽出変換」を参照してください。
- **用語参照変換 **入力に含まれる用語を参照テーブルの用語と照合します。詳細については、「用語参照変換」を参照してください。

参照

次の方法で共有

データマイニングでの Integration Services の使用

接続マネージャ

Analysis Services 接続マネージャ

タスク

Analysis Services DDL 実行タスク

Analysis Services 処理タスク

データマイニングクエリタスク

データフロー変換

データマイニングクエリ変換

データフローの変換先

データマイニングモデルトレーニング変換先

データマイニングのためのその他の Integration Services コンポーネント

参照

概念

その他の技術情報

ヘルプおよび情報

その他のリソース

次の方法で共有

データ マイニングでの Integration Services の使用

接続マネージャ

Analysis Services 接続マネージャ

タスク

Analysis Services DDL 実行タスク

Analysis Services 処理タスク

データ マイニング クエリ タスク

データ フロー変換

データ マイニング クエリ変換

データ フローの変換先

データ マイニング モデル トレーニング変換先

データ マイニングのためのその他の Integration Services コンポーネント

参照

概念

その他の技術情報

ヘルプおよび情報

その他のリソース

データマイニングでの Integration Services の使用

データマイニングクエリタスク

データフロー変換

データマイニングクエリ変換

データフローの変換先

データマイニングモデルトレーニング変換先

データマイニングのためのその他の Integration Services コンポーネント