比较预测模型的预测(数据挖掘中级教程)

您已经创建了以下三个模型:

  • 区域和型号的每个组合的预测,只基于单个型号和区域的数据。

  • 在全球范围对所有型号的预测,基于聚合数据。

  • 在北美区域对 M200 型号的预测,基于聚合模型。

在最后这个任务中,您将比较每个型号的预测,了解使用通用模型如何影响结果。

比较预测结果

请注意,原始挖掘模型在某些区域和型号系列上出现较大的差异。M200 型号的趋势线特别高,而 T1000 型号的趋势线较低且相对平坦。

预测 M200 和 T1000 数量的序列预测 M200 和 T1000 数量的序列

可以通过将结果和原始数据导出到 Microsoft Excel 中来创建包括所有预测的图表。Microsoft Excel 提供了更加复杂的工具,可对多个数据序列进行绘图和管理。下图显示了 M200 产品型号的趋势线,并将第一个挖掘模型的预测与使用聚合挖掘模型的预测进行比较。

用于比较预测的 Excel 图表用于比较预测的 Excel 图表

从该图中,您可以看到聚合挖掘模型使得各个数据系列中的波动变得平滑。下表提供了用于创建图表的部分数据序列,可以进行比较。

序列和挖掘模型

7/25/2004

8/25/2004

9/25/2004

10/25/2004

11/25/2004

M200 Europe — 聚合

143

126

115

119

94

M200 Europe — 特定

121

142

152

149

154

M200 North America — 聚合

208

150

149

151

172

M200 North America — 特定

163

178

156

173

203

M200 Pacific — 聚合

89

80

71

77

57

M200 Pacific — 特定

46

44

42

42

38

T1000 Europe — 聚合

65

51

54

53

48

T1000 Europe — 特定

42

41

43

42

43

T1000 North America — 聚合

103

84

79

85

68

T1000 North America — 特定

82

78

78

83

83

T1000 Pacific — 聚合

68

52

48

56

44

T1000 Pacific — 特定

38

39

37

38

36

结语

您已经学习了如何创建可用于预测的时序模型,以及可以应用于不同数据序列的通用模型。