使用基础模型微调 UI 创建训练运行

重要

该功能在以下区域提供公共预览版：centralus、eastus、eastus2、northcentralus 和 westus。

本文介绍如何使用基础模型微调（现在是马赛克 AI 模型训练的一部分）UI 创建和配置训练运行。也可以使用 API 创建运行。有关说明，请参阅使用基础模型微调 API 创建训练运行。

要求

请参阅要求。

请按照以下步骤操作，使用 UI 创建训练运行。

此时会 打开基础模型微调 窗体。带有星号的项为必填项。进行选择，然后单击“开始训练”。

类型：选择要执行的任务。

任务	说明
指令微调	使用提示和响应输入继续训练基础模型，针对特定任务优化模型。
继续预先训练	继续训练基础模型，使其具有特定领域的知识。
聊天补全	继续使用聊天日志训练基础模型，针对 Q&A 或聊天应用程序进行优化。

选择基础模型：选择要调整或训练的模型。有关支持的模型列表，请参阅支持的模型。

训练数据：单击“浏览”以在 Unity Catalog 中选择表，或输入 Hugging Face 数据集的完整 URL。有关数据大小建议，请参阅模型训练的建议数据大小。

如果在 Unity Catalog 中选择表，还必须选择用于读取表的计算。

注册位置：从下拉菜单中选择 Unity Catalog 目录和架构。已训练的模型将保存到此位置。

模型名称：模型将使用此名称保存在指定的目录和架构中。此字段会显示一个默认的名称，可以根据需要进行更改。

高级选项：若要进行更多自定义，可以为评估、超参数优化或从现有专有模型训练配置可选设置。

设置	说明
训练持续时间	训练运行的持续时间，在时期（例如，`10ep`）或令牌（例如，`1000000tok`）中指定。默认值为 `1ep`。
学习速率	模型训练的学习率。默认值为 `5e-7`。优化器是 DecoupledLionW，beta 版本为 0.99 和 0.95，无权重衰减。学习率计划程序是 LinearWithWarmupSchedule，总训练持续时间的预热率为 2%，最终学习率乘数为 0。
上下文长度	数据样本的最大序列长度。长度超过此设置的数据将被截断。默认值取决于所选的模型。
评估数据	单击“浏览”以在 Unity Catalog 中选择表，或输入 Hugging Face 数据集的完整 URL。如果将此字段留空，则不执行任何评估。
模型评估提示	键入用于评估模型的可选提示。
实验名称	默认情况下，为每个运行分配一个自动生成的新名称。可以选择输入自定义名称，也可以从下拉列表中选择现有试验。
自定义权重	默认情况下，训练一开始使用的是所选模型的原始权重。若要从 Composer 检查点的自定义权重开始，请输入包含检查点值的 Unity Catalog 表的路径。

训练运行完成后，可以在 MLflow 中查看指标，并部署模型进行推理。请参阅教程步骤 5 到 7 ：创建和部署基础模型微调运行。