数据挖掘工具

适用于:SQL Server 2019 及更早版本的 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

数据挖掘在 SQL Server 2017 Analysis Services 中已弃用,现在在 SQL Server 2022 Analysis Services 中已停止使用。 对于已弃用和停止使用的功能,文档不会更新。 若要了解详细信息,请参阅 Analysis Services 后向兼容性

Microsoft SQL Server SQL Server Analysis Services提供可用于创建数据挖掘解决方案的以下工具:

  • 借助 SQL Server Data Tools 中的数据挖掘向导,可以轻松地使用关系数据源或多维数据集中的多维数据创建挖掘结构和挖掘模型。

    在该向导中,您可以选择要使用的数据,然后应用特定的数据挖掘技术,如聚类分析、神经网络或时序建模。

  • 模型查看器在SQL Server Management Studio和SQL Server Data Tools中提供,用于在创建挖掘模型后浏览挖掘模型。 可以使用为每种算法定制的查看器来浏览模型,或使用模型内容查看器进行更深入的分析。

  • SQL Server Management Studio和SQL Server Data Tools中都提供了预测查询生成器,可帮助你创建预测查询。 还可以针对维持数据集或外部数据来测试模型的准确性,或使用交叉验证来评估数据集的质量。

  • SQL Server Management Studio 是用于管理已部署到 SQL Server Analysis Services 实例的现有数据挖掘解决方案的接口。 可以重新处理结构和模型以更新其包含的数据。

  • SQL Server Integration Services 包含可用于清理数据、自动执行创建预测和更新模型等任务以及创建文本挖掘解决方案的工具。

以下部分提供有关 SQL Server 中的数据挖掘工具的详细信息。

中的

可使用数据挖掘向导开始创建数据挖掘解决方案。 该向导简单易用,可指导您完成创建数据挖掘结构和初始相关挖掘模型的过程,其中包括选择算法类型和数据源以及定义用于分析的事例数据等任务。

有关详细信息:数据挖掘向导 (Analysis Services - 数据挖掘)

Data Mining Designer

使用数据挖掘向导创建挖掘结构和挖掘模型后,可以使用SQL Server Data Tools或SQL Server Management Studio中的数据挖掘Designer来处理现有模型和结构。

该设计器包含用于执行以下任务的工具:

  • 修改挖掘结构的属性,添加列并创建列别名,更改值的装箱方法或预期分布。

  • 向现有结构中添加新模型;复制模型,更改模型属性或元数据,或定义挖掘模型的筛选器。

  • 浏览模型中的模式和规则;浏览关联或决策树。 获取有关为

    每个不同的模型时间提供的自定义查看器的详细统计信息,以帮助您分析数据和浏览数据挖掘所显示的模式。

  • 通过创建提升图或分析模型的利润曲线来验证模型。 使用分类矩阵比较模型,或使用交叉验证来验证数据集及其模型。

  • 创建针对现有挖掘模型的预测和内容查询。 生成一次性查询,或设置用于为整个外部数据表生成预测的查询。

SQL Server Management Studio

创建挖掘模型并将其部署到服务器后,可以使用 SQL Server Management Studio 来管理托管数据挖掘对象的SQL Server Analysis Services数据库。 也可以继续执行使用模型的任务,如浏览模型、处理新数据和创建预测。

Management Studio 还包含查询编辑器,可用于设计和执行数据挖掘扩展插件 (DMX) 查询,或使用 XMLA 处理数据挖掘对象。

Integration Services 数据挖掘任务和转换

SQL Server Integration Services 提供了许多支持数据挖掘的组件。

Integration Services 中的某些工具旨在帮助自动执行常见的数据挖掘任务,包括预测、模型生成和处理。 例如:

  • 创建 Integration Services 包,该包在每次使用新客户更新数据集时自动更新模型

  • 对事例记录进行自定义分段或自定义采样。

  • 自动生成通过参数传递的模型。

但是,您还可以在包工作流中将数据挖掘用作其他进程的输入。 例如:

  • 使用模型所生成的概率值来加权文本挖掘或其他分类任务的分数。

  • 基于之前的数据自动生成预测,并使用这些值来评估新数据的有效性。

  • 使用逻辑回归按风险划分传入客户。

有关详细信息:数据挖掘解决方案的相关项目

另请参阅

数据挖掘扩展插件 (DMX) 参考
挖掘模型任务和操作指南
挖掘模型查看器任务和操作指南
数据挖掘解决方案