数据挖掘基础教程
欢迎使用 Microsoft Analysis Services 数据挖掘基础教程。Microsoft SQL Server 提供了一个用来创建和处理数据挖掘模型的集成环境。在本数据挖掘基础教程中,您将完成一个用于目标邮寄活动的方案,在此方案中您将创建三个模型,用来分析客户购买行为并确定潜在购买目标。本教程说明了 Microsoft SQL Server Analysis Services 中所包含的数据挖掘算法、挖掘模型查看器和数据挖掘工具的使用方法。虚构公司 Adventure Works Cycles 用于所有的示例。
熟练使用数据挖掘工具后,建议您完成数据挖掘中级教程,该程说明了预测、市场篮分析、时序、关联模型、嵌套表以及顺序分析和聚类分析的使用方法。
教程方案
在本教程中,您是 Adventure Works Cycles 的一名员工,需要根据历史购买情况来详细了解该公司的客户,然后使用这些历史数据进行可用于营销的预测。公司以前从未进行过数据挖掘,因此您必须创建一个专门用于数据挖掘的新数据库并建立几个数据挖掘模型。
学习内容
本教程将讲述如何创建和使用数种不同类型的数据挖掘模型。还将述如何创建挖掘模型的副本以及如何对掘模型应用筛选器。随后,您将处理新模型并使用提升图评估该模型。在该模型完成之后,将使用钻取功能从基础挖掘结构检索其他数据。
在 SQL Server 2008 中,Microsoft 引入了几个新功能,可帮助您开发自定义数据挖掘模型并且更有效地使用结果。
维持测试集 - 现在,当创建挖掘结构时,可以将挖掘结构中的数据分为定型集和测试集。
挖掘模型筛选器 - 现在,可以将筛选器附加到挖掘模型,并在定型和测试期间应用筛选器。
钻取到结构事例和结构列 - 现在,可以从挖掘模型中的通用模式方便地移到数据源中的可行详细信息。
本教程分为以下几课:
第 1 课:准备 Analysis Services 数据库(数据挖掘基础教程)
在本课程中,您将学习如何创建新的 Analysis Services 数据库,添加数据源和数据源视图,以及准备将用于数据挖掘的新数据库。第 2 课:生成 Targeted Mailing 结构(数据挖掘基础教程)
在本课中,您将学习如何创建可用作目标邮寄方案一部分的挖掘模型结构。第 3 课:添加和处理模型
在本课中,您将学习如何向结构中添加模型。您创建的模型是用如下算法生成的:Microsoft 决策树
Microsoft 聚类分析
Microsoft Naive Bayes
第 4 课:浏览 Targeted Mailing 模型(数据挖掘基础教程)
在本课中,您将学习如何使用查看器浏览和解释在每个模型中发现的内容。第 5 课:测试模型(数据挖掘基础教程)
在本课中,您将创建某个 Targeted Mailing 模型的副本,添加一个挖掘模型筛选器以将定型数据限制在特定客户集,然后评估该模型的可行性。第 6 课:创建和使用预测(数据挖掘基础教程)
在本数据挖掘基础教程的最后一课中,您将使用该模型预测哪些客户最有可能购买自行车。随后,您将钻取到基础事例以获取联系信息。
要求
请确保已安装下列软件:
Microsoft SQL Server 2008 R2
Microsoft SQL Server Analysis Services
AdventureWorksDW2008R2 数据库。
为了增强安全性,示例数据库不随 SQL Server 一起安装。 若要安装 Microsoft SQL Server 的正式数据库,请访问 Microsoft SQL Sample Databases(Microsoft SQL 示例数据库)页,并选择 SQL Server 2008R2。
注意 |
---|
阅读教程时您可能会发现,如果在文档查看器工具栏中添加“下一个主题”和“上一个主题”按钮,在各个步骤间来回移动会更容易。有关详细信息,请参阅向帮助中添加“上一步”和“下一步”按钮。 |