使用基础模型微调 UI 创建训练运行

重要

该功能在以下区域提供公共预览版centraluseastuseastus2northcentraluswestus

本文介绍如何使用基础模型微调(现在是马赛克 AI 模型训练的一部分)UI 创建和配置训练运行。 也可以使用 API 创建运行。 有关说明,请参阅 使用基础模型微调 API 创建训练运行。

要求

请参阅 要求

使用 UI 创建训练运行

请按照以下步骤操作,使用 UI 创建训练运行。

  1. 在左侧边栏中,单击“试验”。

  2. 基础模型微调 卡上,单击“ 创建马赛克 AI 模型试验”。

    基础模型试验窗体

  3. 此时会 打开基础模型微调 窗体。 带有星号的项为必填项。 进行选择,然后单击“开始训练”。

    类型:选择要执行的任务。

    任务 说明
    指令微调 使用提示和响应输入继续训练基础模型,针对特定任务优化模型。
    继续预先训练 继续训练基础模型,使其具有特定领域的知识。
    聊天补全 继续使用聊天日志训练基础模型,针对 Q&A 或聊天应用程序进行优化。

    选择基础模型:选择要调整或训练的模型。 有关支持的模型列表,请参阅支持的模型

    训练数据:单击“浏览”以在 Unity Catalog 中选择表,或输入 Hugging Face 数据集的完整 URL。 有关数据大小建议,请参阅模型训练的建议数据大小

    如果在 Unity Catalog 中选择表,还必须选择用于读取表的计算。

    注册位置:从下拉菜单中选择 Unity Catalog 目录和架构。 已训练的模型将保存到此位置。

    模型名称:模型将使用此名称保存在指定的目录和架构中。 此字段会显示一个默认的名称,可以根据需要进行更改。

    高级选项:若要进行更多自定义,可以为评估、超参数优化或从现有专有模型训练配置可选设置。

    设置 说明
    训练持续时间 训练运行的持续时间,在时期(例如,10ep)或令牌(例如,1000000tok)中指定。 默认值为 1ep
    学习速率 模型训练的学习率。 默认值为 5e-7。 优化器是 DecoupledLionW,beta 版本为 0.99 和 0.95,无权重衰减。 学习率计划程序是 LinearWithWarmupSchedule,总训练持续时间的预热率为 2%,最终学习率乘数为 0。
    上下文长度 数据样本的最大序列长度。 长度超过此设置的数据将被截断。 默认值取决于所选的模型。
    评估数据 单击“浏览”以在 Unity Catalog 中选择表,或输入 Hugging Face 数据集的完整 URL。 如果将此字段留空,则不执行任何评估。
    模型评估提示 键入用于评估模型的可选提示。
    实验名称 默认情况下,为每个运行分配一个自动生成的新名称。 可以选择输入自定义名称,也可以从下拉列表中选择现有试验。
    自定义权重 默认情况下,训练一开始使用的是所选模型的原始权重。 若要从 Composer 检查点的自定义权重开始,请输入包含检查点值的 Unity Catalog 表的路径。

后续步骤

训练运行完成后,可以在 MLflow 中查看指标,并部署模型进行推理。 请参阅教程步骤 5 到 7 :创建和部署基础模型微调运行

请参阅指令微调:命名实体识别演示笔记本,查看指令微调示例,按步骤进行数据准备、微调训练运行配置和部署。