你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

如何在 Azure AI Foundry 门户中对模型进行基准检验

重要

本文中标记了“（预览版）”的项目目前为公共预览版。此预览版未提供服务级别协议，不建议将其用于生产工作负载。某些功能可能不受支持或者受限。有关详细信息，请参阅 Microsoft Azure 预览版补充使用条款。

本文将介绍如何使用 Azure AI Foundry 门户中的模型基准检验工具比较模型和数据集之间的基准。你还将学习如何分析基准检验结果并使用数据执行基准检验。基准检验可以帮助你就哪些模型符合特定用例或应用程序的要求做出明智的决定。

先决条件

Azure AI 支持对流行且最常用的精选模型进行模型基准检验。按照以下步骤，使用详细的基准检验结果直接从 Azure AI Foundry 模型目录中比较和选择模型：

选择你感兴趣的模型。例如，选择 gpt-4o。此操作将打开模型的概述页面。

提示

在模型目录中，可以使用“集合”筛选器并选择“基准检验结果”来显示提供基准检验的模型。这些模型有一个看起来像直方图的“基准检验”图标。
转到“基准检验”选项卡，以检查模型的基准检验结果。
返回模型目录的主页。
在模型目录的主页上选择“比较模型”，探索支持基准检验的模型，查看其指标，并分析不同模型的优劣。此分析有助于选择最符合要求的模型。
选择所需的任务并指定感兴趣的维度，例如 AI 质量与成本，以评估不同模型的优劣。
可以切换到列表视图，以访问每个模型的更详细结果。