数据挖掘中级教程(Analysis Services - 数据挖掘)
Microsoft Analysis Services 提供用于创建和使用数据挖掘模型的集成环境。 您可以方便地绑定到数据源、针对同一个数据创建和测试多个模型并部署要用于进行预测分析的模型。
在数据挖掘基础教程中,您学习了如何使用 SQL Server Data Tools (SSDT) 创建数据挖掘解决方案,而且生成了三个支持目标邮递活动的模型,这些模型可用来分析客户购买行为并确定潜在的购买目标。
本中级教程基于这些经验而构建,其中介绍了几个新方案(包括预测和市场篮分析等常见业务要求)。 您将学习如何创建时序模型、关联模型以及顺序分析和聚类分析模型。 最后,您将学习如何使用神经网络了解数据相关性,以及使用逻辑回归进行预测。
这些课程是相互独立的,可以单独完成。
为了完成以下教程,您应该熟悉数据挖掘基础教程中所介绍的数据挖掘工具和挖掘模型查看器。
所有的方案都使用 AdventureWorksDW2012 数据源,但是您将为不同的方案创建不同的数据源视图。 只要您是首先创建数据源,就可以按任何顺序做练习。
课程方案
在成功完成目标邮寄活动之后,系统已经要求您利用自己的数据挖掘知识来开发几个要用于进行业务规划的新模型。 其中包括以下任务:
**预测:**您将创建一个“时序”模型,用来预测产品在全世界不同地区的销售额。 您将为每个地区开发单独的模型,并了解如何使用“交叉预测”。
**市场篮分析:**您将创建一个“关联模型”,用于分析在访问 Adventure Works Cycles 电子商务网站时所购买产品的分组。 您可以基于这个市场篮模型为客户推荐产品。
**顺序分析:**您将生成一个“顺序分析和聚类分析模型”,用于分析客户购买产品的顺序。 您可以基于这个模型规划对网站设计或新产品进行的更改。
**因素分析:**使用“神经网络”模型了解呼叫中心数据服务质量差的可能原因。 基于对基础模型的理解,您将创建一个“逻辑回归模型”,用于预测可供改进客户体验的策略。
学习内容
本教程将讲述如何创建和使用多种类型的数据挖掘算法。 本教程分为以下几课:
第 1 课:创建中级数据挖掘解决方案(数据挖掘中级教程)
在本课中,您将基于 AdventureWorksDW2012 数据库创建一个新的项目,以便支持多个新数据源视图和更多的挖掘模型。第 2 课:生成预测方案(数据挖掘中级教程)
在本课中,您将创建一个可用作预测方案一部分的挖掘模型, 还将浏览用 Microsoft 时序算法生成的挖掘模型。您将为每个地区生成单独的模型,而且还生成一个可用于进行交叉预测的通用模型。
第 3 课:生成市场篮方案(数据挖掘中级教程)
在本课中,您将添加一个新的数据源视图,并学习如何处理嵌套表及其键。 您将基于此数据创建一个可用作市场篮方案一部分的挖掘模型。 您还将浏览用 Microsoft 关联算法生成的挖掘模型。第 4 课:生成顺序分析和聚类分析方案(数据挖掘中级教程)
在本课中,您将创建一个可用作顺序分析和聚类分析方案一部分的挖掘模型, 还将学习如何利用通过 Microsoft 顺序分析和聚类分析算法生成的挖掘模型。第 5 课:生成神经网络模型和逻辑回归模型(数据挖掘中级教程)
在本课中,您将使用 Microsoft 神经网络和 Microsoft 逻辑回归算法创建若干相关的挖掘模型。 您还将学习如何使用数据源视图来基于模型浏览数据。
要求
请确保已安装下列软件:
Microsoft SQL Server 2012
Microsoft SQL Server Analysis Services
带有 AdventureWorksDW2012 数据库的 SQL Server。
为了增强安全性,默认情况下将不安装该示例数据库。 若要安装 Microsoft SQL Server 的正式数据库,请访问 Microsoft SQL 示例数据库页,并选择示例数据库的适当版本。