建立新的採礦結構
當您在 Microsoft SQL Server Analysis Services 中建立資料採礦方案時,第一個步驟是使用 Business Intelligence Development Studio 中的資料採礦精靈 (Analysis Services - 資料採礦)來建立採礦結構。採礦結構會定義用來建立採礦模型的資料網域。所有採礦模型都是以結構為基礎。
採礦結構會使用關聯式或線上分析處理 (OLAP) 資料來源。關聯式採礦結構是以儲存在資料表、檔案或關聯式資料庫系統中的資料為基礎,而且該資料已經定義為成資料來源檢視。OLAP 採礦結構是以 OLAP Cube (與採礦結構存在相同的資料庫上) 中的維度和相關量值為基礎。
**如需詳細資訊,請參閱:**<設計資料庫>、<設計 Analysis Services 多維度資料庫物件>。
資料採礦精靈會自動定義採礦結構,並讓您將初始採礦模型加入至結構中。因為採礦結構可以包含多個採礦模型,所以您可以使用<資料採礦設計師>來加入更多採礦模型到結構中。
下列章節將提供有關使用資料採礦精靈建立新採礦結構的詳細資訊,以及如何在採礦結構上設定選項,以便讓您針對採礦結構中的資料建立測試集或執行查詢。
建立關聯式採礦結構
建立 OLAP 採礦結構
啟用鑑效組和鑽研
建立關聯式採礦結構
關聯式採礦結構能夠以透過 OLE DB 資料來源取得的任何資料為基礎。如果來源資料是包含在多份資料內,您可以建立會同時帶入您所需之資料表與資料行的資料來源檢視。如果資料表包含任何一對多關聯性 (例如,對於每一個想要分析的客戶都有多筆訂購記錄),那麼您可以同時加入兩個資料表,然後使用其中一個資料表做為案例資料表,並將來自關聯性多側中的資料做為巢狀資料表。
**如需詳細資訊,請參閱:**<巢狀資料表 (Analysis Services - 資料採礦)>。
資料採礦精靈會引導您透過下列步驟,來建立新採礦模型的結構:
選取資料來源類型,以此案例而言是指關聯式資料庫。
決定要單獨建立結構,還是要建立含有採礦模型的結構。
選取模型的演算法。
選取資料來源
選取案例資料表和任何巢狀資料表 (選擇性)。
選取每個資料行的類型:可預測、輸入或索引鍵。
指定資料行內容類型。
指定選擇性的鑑效組資料集。
針對結構啟用鑽研。命名並儲存新的採礦結構和相關聯的採礦模型。
**如需詳細資訊,請參閱:**<資料採礦演算法 (Analysis Services - 資料採礦)>、<採礦模型資料行>、<採礦結構資料行>、<資料類型 (資料採礦)>、<內容類型 (資料採礦)>
建立 OLAP 採礦結構
OLAP Cube 經常包含很多成員和維度,導致難以得知開始進行資料採礦的位置。為了協助識別 Cube 所包含的模式,您通常會識別重要的單一維度,然後再開始探索與該維度相關的模式。下表會列出數個常見的 OLAP 資料採礦工作,描述您可套用每個工作的範例狀況,並識別用於每一個工作的資料採礦演算法。
工作 |
範例狀況 |
演算法 |
---|---|---|
將成員組成群集 |
依據客戶成員屬性、客戶購買的產品和客戶花費的金額,來分割客戶維度。 |
Microsoft 群集演算法 |
尋找特別的或異常的成員 |
依據銷售量、收益、商店位置和商店大小,在商店維度中識別特別的或異常的商店。 |
Microsoft 決策樹演算法 |
尋找特別的或異常的資料格 |
識別一段時間後與典型趨勢相反的商店銷售。 |
Microsoft 時間序列演算法 |
資料採礦精靈會引導您完成下列程序,以便建立新採礦模型的結構:
選取資料來源類型,以此案例而言是指 Cube。
[!附註]
此 OLAP Cube 必須與採礦結構存在於相同的資料庫中。您無法使用 PowerPivot for Excel 增益集建立的 Cube 做為資料採礦的來源。
選取演算法。
選取來源 Cube 維度。
選取案例索引鍵。
選取案例資料行。
選取任何巢狀資料表。
選取每個資料行的使用方式:可預測、輸入或索引鍵。
指定資料行內容類型。
配量來源 Cube。
建立選擇性的測試資料集。
命名及儲存新的採礦結構和相關聯的採礦模型。
您可以在精靈的最後一頁設定下列選項:
允許使用鑽研
建立採礦模型維度
使用採礦模型維度建立 Cube
如果您選擇要在來源 Cube 中建立新的採礦模型維度,您可以包括資料採礦演算法在 OLAP 資料來源中尋找的資訊。您可以透過建立採礦模型維度,以維度的形式瀏覽並查詢已儲存的模型內容。這個選項適用於使用 Microsoft 群集、Microsoft 決策樹和 Microsoft 關聯規則演算法所建立的模型。
如果您選取要建立新 Cube 的選項,則新的 Cube 會定義在包括採礦模型維度 (及選擇性地包含任何相關維度) 的資料庫上。這樣可以讓您根據採礦模型所找出的階層來配量事實資料。
**如需詳細資訊,請參閱:**<資料採礦演算法 (Analysis Services - 資料採礦)>、<採礦模型資料行>、<採礦結構資料行>、<資料類型 (資料採礦)>、<內容類型 (資料採礦)>
啟用鑽研和鑑效組
當您建立採礦結構時,必須同時設定兩個重要的選項,以便使用資料:「鑑效組」(Holdout) 和「鑽研」(Drillthrough)。鑑效組可以讓您將採礦結構中的資料分割成培訓集和測試集,以便搭配與該結構相關聯的所有模型使用。如需詳細資訊,請參閱<將資料分割成培訓集和測試集 (Analysis Services - 資料採礦)>。
鑽研可讓您透過查詢採礦模型,檢視採礦結構中的來源資料。當您要檢視採礦模型的結果,而且想要查看基礎案例的其他詳細資料時,這項功能便很有用。例如,您可能會想要尋找連絡資訊、用來培訓特定群集的案例,以及其他資料。若要使用鑽研,您必須在建立採礦結構時啟用它,無法在建立之後啟用它。如需詳細資訊,請參閱<針對採礦模型和採礦結構使用鑽研 (Analysis Services - 資料採礦)>。