使用更新数据进行时序预测(数据挖掘中级教程)
使用扩展的销售额数据创建预测
在本课中,您将创建一个预测查询,该查询将新的销售额数据添加到模型。 通过使用新数据扩展模型,您可以获得最新预测,其中包括最新的数据点。
创建使用新数据的时序预测很容易:只需要将参数 EXTEND_MODEL_CASES 添加到 PredictTimeSeries (DMX) 函数,指定新数据的源并指定您要获取多少预测。
注意 |
---|
参数 EXTEND_MODEL_CASES 是可选的;默认情况下,通过联接新数据作为输入将该模型扩展您创建时序预测查询的任意时间。 |
生成预测查询和添加新数据
如果模型尚未打开,请双击 Forecasting 结构,并在数据挖掘设计器中单击**“挖掘模型预测”**选项卡。
在**“挖掘模型”窗格中,应该已选择模型 Forecasting。 如果尚未选择该模型,请单击“选择模型”**,然后选择模型 Forecasting。
在**“选择输入表”窗格中,单击“选择事例表”**。
在**“选择表”**对话框中,选择数据源 Adventure Works DW Multidimensional 2012 。
从数据源视图列表中,选择 NewSalesData,然后单击**“确定”**。
右键单击设计区域图面,然后选择**“修改连接”**。
使用**“修改映射”**对话框,将模型中的列映射到外部数据中的列,如下所示:
将挖掘模型中的 ReportingDate 列映射到输入数据中的 NewDate 列。
将挖掘模型中的 Amount 列映射到输入数据中的 NewAmount 列。
将挖掘模型中的 Quantity 列映射到输入数据中的 NewQty 列。
将挖掘模型中的 ModelRegion 列映射到输入数据中的 Series 列。
现在,您将生成预测查询。
首先,将一个列添加到预测查询来输出预测应用到的序列。
在网格中单击第一个空行,然后在**“源”**下选择 Forecasting。
在**“字段”列中选择 Model Region,为“别名”**键入 Model Region。
接下来,添加和编辑预测函数。
单击一个空行,然后在**“源”下选择“预测函数”**。
对于**“字段”**,请选择 PredictTimeSeries。
对于**“别名”**,键入 Predicted Values。
将字段 Quantity 从**“挖掘模型”窗格拖到“条件/参数”**列。
在**“条件/参数”**列中,在该字段名称的后面键入下面的文本: 5,EXTEND_MODEL_CASES
**“条件/参数”**文本框中的完整文本应该如下所示:[Forecasting].[Quantity],5,EXTEND_MODEL_CASES
单击**“结果”**并查看结果。
预测从 7 月(原始数据结束后的第一个时间段)开始,到 11 月结束(原始数据结束后的第 5 个时间段)。
您可以看到,要高效使用此预测查询类型,您需要知道旧数据何时结束以及新数据中有多少时间段。
例如,在此模型中,原始数据序列 6 月结束,并且数据针对 7 月、 8 月和 9 月。
使用 EXTEND_MODEL_CASES 的预测始终在原始数据序列结束时开始。 因此,如果您只想获取未知月份的预测,则需要指定预测的起点和终点。 这两个值被指定为从旧数据结束时开始的一些时间段。
下面的过程演示如何做到这点。
更改预测的起点和终点
在预测查询生成器中,单击**“查询”**以切换到 DMX 视图。
找到包含 PredictTimeSeries 函数的 DMX 语句并按以下方式更改它:
PredictTimeSeries([Forecasting 12].[Quantity],4,6,EXTEND_MODEL_CASES)
单击**“结果”**并查看结果。
现在预测从 10 月开始(原始数据结束后的第四个时间段),到 12 月结束(原始数据结束后的第六个时间段)。