为预测查询选择和映射输入数据
适用于:SQL Server 2019 及更早版本的 Analysis Services Azure Analysis Services Fabric/Power BI Premium
重要
数据挖掘在 SQL Server 2017 Analysis Services 中已弃用,现在在 SQL Server 2022 Analysis Services 中已停止使用。 对于已弃用和停止使用的功能,文档不会更新。 若要了解详细信息,请参阅 Analysis Services 后向兼容性。
在您根据挖掘模型创建预测时,通常通过向模型馈送新数据来创建预测。 (时序模型是个例外情况,它只能基于历史数据进行预测。)若要向模型提供新数据,您必须确保数据可作为数据源视图的一部分提供。 如果您事先知道哪些数据将用于预测,则可以在用于创建模型的数据源视图中包括这些数据。 否则,您可能需要创建一个新的数据源视图。 有关详细信息,请参阅 多维模型中的数据源视图。
有时候,您所需的数据可能包含在一对多联接中的多个表内。 用于关联模型或顺序分析和聚类分析模型的数据便是这种情况,它们将使用链接到包含产品或事务详细信息的嵌套表的事例表。 如果您的模型使用事例嵌套表结构,则您用于预测的数据也必须具有事例嵌套表结构。
警告
不能添加位于其他数据源视图中的新列或映射列。 选择的数据源视图必须包含预测查询所需的所有列。
在您确定了包含将用于预测的数据的表后,必须将外部数据中的列映射到挖掘模型中的列。 例如,如果您的模型基于人口统计信息和调查响应预测客户购买行为,则您的输入数据应包含与模型中的数据通常对应的信息。 您无需对每个单列都具有匹配的数据,但可以匹配的列越多,预测效果就越好。 如果您尝试映射具有不同数据类型的列,则系统可能会显示错误消息。 在此情况下,您可以在数据源视图中定义命名计算,以便将新的列数据强制转换或转换为模型所需的数据类型。 有关详细信息,请参阅 在数据源视图中定义命名计算 (Analysis Services) 。
在您选择要用于预测的数据时,所选数据源中的某些列可能会基于名称相似性和匹配的数据类型,自动映射到挖掘模型列。 可以使用 “挖掘模型预测” 中的 “修改映射” 对话框更改映射的列、删除不合适的映射或为现有列创建新映射。 “挖掘模型预测”设计图面还支持连接的拖放编辑。
若要创建新连接,只需在“挖掘模型”表中选择一列,然后将该列拖到“选择输入表”表中的对应列上。
若要删除某个连接,请选中该连接线,然后按 Delete 键。
下面的过程说明如何使用 “指定嵌套联接” 对话框修改在事例表和嵌套表之间创建的、用作预测查询输入的联接。
选择输入表
在“数据挖掘Designer SQL Server Data Tools中”挖掘准确性图表“选项卡的”选择输入表“ () 表中,单击”选择事例表”。
此时将打开 “选择表” 对话框,在该对话框中,您可以选择包含查询所基于的数据的表。
在 “选择表” 对话框中,从 “数据源” 列表中选择数据源。
在“表/视图名称”下,选择包含希望用于测试模型的数据的表。
单击 “确定” 。
挖掘结构中的列将自动映射到输入表中相同名称的列。
更改输入数据映射到模型的方式
在 SQL Server Data Tools 中的数据挖掘Designer中,选择“挖掘模型预测”选项卡。
在 “挖掘模型” 菜单中,选择 “修改连接”。
此时,将打开 “修改映射” 对话框。 在此对话框中, “挖掘模型列” 列中列出了所选挖掘结构中的列。 “表列”列中列出了在“选择输入表”对话框中选择的外部数据源中的列。 外部数据源中的列将映射到挖掘模型中的列。
在 “表列”下,选择与要映射到的挖掘模型列相对应的行。
从外部数据源可用列的列表中选择一个新列。 选择列表中的空白项以删除列映射。
单击 “确定” 。
设计器中将显示新的列映射。
删除各输入表之间的关系
在SQL Server Data Tools中“数据挖掘Designer的”挖掘模型预测“选项卡的”选择输入表“ () 表中,单击”修改联接”。
此时,将打开 “指定嵌套联接” 对话框。
选择关系。
单击 “删除关系”。
单击 “确定” 。
这样便可删除事例表和嵌套表之间的关系。
创建各输入表之间新的关系
在数据挖掘设计器中“挖掘模型预测”选项卡的“选择输入表”表上,单击“修改联接”。
此时,将打开 “指定嵌套联接” 对话框。
单击 “添加关系”。
将打开 “创建关系” 对话框。
在 “源列”中选择嵌套表的键。
在 “目标列”中选择事例表的键。
在 “创建关系” 对话框中,单击 “确定” 。
在 “指定嵌套联接” 对话框中,单击 “确定” 。
这样便在事例表和嵌套表之间创建了新的关系。
将嵌套表添加到预测查询的输入表
在数据挖掘设计器的 “挖掘模型预测” 选项卡中,单击 “选择事例表” 打开 “选择表” 对话框。
注意
如果尚未指定事例表,则不能将嵌套表添加到输入中。 使用嵌套表要求您正用于预测的挖掘模型也使用嵌套表。
在 “选择表” 对话框中,从 “数据源” 列表中选择一个数据源,然后在数据源视图中选择包含事例数据的表。 单击 “确定” 。
单击 “选择嵌套表” 打开 “选择表” 对话框。
在 “选择表” 对话框中,从 “数据源” 列表中选择一个数据源,然后在数据源视图中选择包含嵌套数据的表。 单击 “确定” 。
如果已经存在关系,则挖掘模型中的列将自动映射到输入表中具有相同名称的列。 通过单击 “修改联接”以打开 “创建关系” 对话框,可以修改嵌套表与事例表之间的关系。