使用 Microsoft Fabric 训练模型并对其进行评分
引入、浏览和预处理数据后,可以使用该数据来训练模型。 训练模型是一个迭代过程,而你希望能够跟踪工作。
Microsoft Fabric 与 MLflow 集成,可轻松跟踪和记录工作,使你能够随时查看工作,以确定训练最终模型的最佳方法是什么。 跟踪工作时,可以很容易重现结果。
要跟踪的任何工作都可以作为试验进行跟踪。
了解试验
每当在笔记本中训练要跟踪的模型,都可以在 Microsoft Fabric 中创建试验。
一个试验可以包含多个运行。 每个“运行”都表示在笔记本中执行的任务,例如训练机器学习模型。
例如,若要训练用于销售预测的机器学习模型,可以使用相同的算法尝试不同的训练数据集。 每次使用不同的数据集训练模型时,都会创建新的试验运行。 然后,可以比较试验运行以确定性能最佳的模型。
开始跟踪指标
若要比较试验运行,可以跟踪每个运行的参数、指标和项目。
试验概述中显示了在试验运行中跟踪的所有参数、指标和项目。 可以在“运行详细信息”选项卡中单独查看试验运行,或使用“运行列表”比较各个运行:
通过使用 MLflow 跟踪工作,可以比较模型训练迭代,并确定哪种配置为用例提供最佳模型。
了解模型
训练模型后,你想要使用它进行评分。 通过评分,可以对新数据使用模型来生成预测或见解。 使用 MLflow 训练和跟踪模型时,项目存储在试验运行中以表示模型及其元数据。 可以在 Microsoft Fabric 中将这些项目保存为模型。
通过在 Microsoft Fabric 中将模型项目保存为已注册的模型,可以轻松管理模型。 每当训练新模型并将其保存在同一名称下时,你都可以向该模型添加新版本。
使用模型生成见解
若要使用模型生成预测,可以使用 Microsoft Fabric 中的 PREDICT 函数。 PREDICT 函数可与 MLflow 模型轻松集成,让你可以使用该模型生成批量预测。
例如,每周你都会收到来自多个商店的销售数据。 根据历史数据,你训练了一个模型,该模型可以根据过去几周的销售额预测下周的销售额。 你使用 MLflow 跟踪模型并将其保存在 Microsoft Fabric 中。 每当新的每周销售数据传入时,你都可使用 PREDICT 函数让模型生成下周的预测。 预测的销售数据以表的形式存储在湖屋中,该数据在 Power BI 报表中进行可视化,以供业务用户使用。