適用於: SQL Server 2019 和舊版 Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
重要
SQL Server 2017 Analysis Services 中已淘汰數據採礦,現在已在 SQL Server 2022 Analysis Services 中停止。 檔不會更新為已淘汰和已停止的功能。 若要深入瞭解,請參閱 Analysis Services 回溯相容性。
您可以使用 Microsoft SQL Server SQL Server Analysis Services 中的數據採礦精靈來建立採礦結構,以使用多維度模型的數據。 以 OLAP Cube 為基礎的採礦模型可以使用事實數據表、維度和量值群組中的數據行和值作為分析的屬性。
建立新的OLAP採礦結構
在 SQL Server Data Tools 的方案總管中,以滑鼠右鍵按兩下 SQL Server Analysis Services 專案中 採礦結構 資料夾,然後按兩下 [新的採礦結構] 開啟 [數據採礦精靈]。
在 [歡迎使用數據採礦精靈] 頁面上,按兩下 [下一步]。
在 [
選取定義方法 ] 頁面上,選取 [從現有的 Cube選取 [],然後按兩下 [下一步] 。 如果您收到訊息錯誤,則無法擷取支援的數據採礦演算法清單,請開啟 [項目屬性] 對話框,並確認您已指定支援多維度模型的 Analysis Services 實例名稱。 您無法在支援表格式模型的 SQL Server Analysis Services 實例上建立採礦模型。
在 [[建立數據採礦結構] 頁面上,決定是否只建立採礦結構,或採礦結構加上一個相關的採礦模型。 一般而言,您可以更輕鬆地同時建立採礦模型,以便提示您包含必要的數據行。
如果您要建立採礦模型,請選擇要使用的數據採礦演算法,然後按下一步]
。 如需如何選擇演算法的詳細資訊,請參閱 數據採礦演算法(Analysis Services - 資料採礦)。 在 [選取來源 Cube 維度] 頁面的 [選取來源 Cube 維度]下,找出包含大部分案例數據的維度。
例如,如果您嘗試識別客戶群組,您可以選擇 [客戶] 維度;如果您嘗試分析交易之間的購買,您可以選擇 [因特網銷售訂單詳細數據] 維度。 您不限於只使用此維度中的數據,而是應該包含分析中使用的重要屬性。
點選 [下一步] 。
在 [選取案例密鑰] 頁面的 [屬性]下,選取將成為採礦結構索引鍵的屬性,然後按兩下 [下一步]。
您作為採礦結構索引鍵的屬性通常是維度的索引鍵,而且會預先選取。
在 [選取案例層級數據行] 頁面上,在 [相關屬性和量值]下,選取包含您要新增至採礦結構作為案例數據之值的屬性和量值。 點選 [下一步] 。
在 [指定採礦模型數據行使用] 頁面上,於 [採礦模型結構] 底下,先設定可預測的數據行,然後選擇要作為輸入的數據行。
選取最左邊數據行中的複選框,以在採礦結構中包含數據。 您可以在將用於參考的 結構中包含數據行,但不能用於分析。
選取 [Input] 數據行中的複選框,以使用 屬性作為分析中的變數。
僅針對可預測屬性選取 [Predict] 數據行中的複選框。
請注意,您指定為索引鍵的數據行無法用於輸入或預測。
點選 [下一步] 。
在 [指定採礦模型數據行使用] 頁面上,您也可以使用 [新增巢狀數據表 和 巢狀數據表,將巢狀數據表新增和移除至採礦結構。
在 OLAP 採礦模型中,巢狀數據表是 Cube 內另一組數據,其與代表案例屬性的維度有一對多關聯性。 因此,當對話框開啟時,它會預先選取與您選取為案例數據表之維度相關的量值群組。 此時,您可以選擇不同的維度,其中包含可用於分析的其他資訊。
例如,如果您要分析客戶,您會使用 [Customer] 維度作為案例數據表。 針對巢狀數據表,您可以新增購買時所引用客戶的原因,其包含在 [銷售原因] 維度中。
如果您新增巢狀數據,則必須指定兩個額外的數據列:
巢狀數據表的索引鍵:這應該在頁面上預先選取,選取巢狀數據表索引鍵。
要用於分析的屬性或屬性:頁面,選取巢狀數據表數據行,提供巢狀數據表選取範圍中的量值和屬性清單。
針對您包含在模型中的每個屬性,核取左側數據行中的方塊。
如果您要只使用 屬性進行分析,請檢查 Input。
如果您要將資料行納入為模型的其中一個可預測屬性,請選擇 [Predict。
您在 結構中包含但未指定為輸入或可預測屬性的任何專案,會新增至具有旗標的 結構,Ignore;這表示當您建置模型但未用於分析時,會處理數據,而且僅適用於鑽研。 如果您想要包含客戶名稱等詳細數據,但不想在分析中使用這些詳細數據,這很有用。
按兩下 [完成] [完成] 關閉精靈中與巢狀數據表搭配運作的部分。 您可以重複此程式以新增多個巢狀資料列。
在 [[指定數據行的內容和數據類型] 頁面上,於 [採礦模型結構] 下,設定每個數據行的內容類型和數據類型。
注意
OLAP 採礦模型不支援使用 偵測 功能來自動偵測數據行是否包含連續或離散數據。
點選 [下一步] 。
在 [配量來源 Cube] 頁面上,您可以篩選用來建立採礦結構的數據。
切割 Cube 可讓您限制用來建置模型的數據。 例如,您可以藉由在 Geography 階層和 上切割,為每個區域建置個別的模型
維度:從下拉式清單中選擇相關的維度。
階層:選取您要套用篩選的維度階層層級。 例如,如果您要依 [Geography] 維度切割,您可以選擇階層層級,例如 [地區國家/地區名稱] 。
運算子:從清單中選擇運算符。
篩選表示式:輸入做為篩選條件的值或表示式,或使用下拉式清單從階層指定層級的成員清單中選取值。
例如,如果您選取 [Geography] 作為維度,並將 [區域國家/地區名稱] 選取為階層層級,下拉式清單會包含所有可用來作為篩選條件的有效國家/地區。 您可以進行多個選取。 因此,採礦結構中的數據會受限於來自這些地理區域的 Cube 數據。
參數:忽略此複選框。 此對話框支援多個 Cube 篩選案例,而且此選項與建置採礦結構無關。
點選 [下一步] 。
在 [將數據分割成定型和測試集 頁面上,指定要保留用於測試的採礦結構數據百分比,或指定測試案例數目上限。 點選 [下一步] 。
如果您指定這兩個值,則會結合限制來使用最低值。
在 [完成精靈] 頁面上,提供新的 OLAP 採礦結構和初始採礦模型的名稱。
點選 [完成] 。
在 [完成精靈] 頁面上,您也可以選擇使用採礦模型維度建立採礦模型維度和/或 Cube。 這些選項僅支援使用下列演算法所建置的模型:
Microsoft叢集演算法
Microsoft判定樹演算法
Microsoft關聯規則演算法
建立採礦模型維度:選取此複選框,並提供採礦模型維度的類型名稱。 當您使用此選項時,會在用來建置採礦結構的原始 Cube 內建立新的維度。 您可以使用這個維度向下切入並進行進一步的分析。 因為維度位於 Cube 內,因此維度會自動對應至案例數據維度。
使用採礦模型維度建立 Cube:選取此複選框,並提供新 Cube 的名稱。 當您使用此選項時,會建立新的 Cube,其中包含建置結構時所使用的現有維度,以及包含模型結果的新數據採礦維度。