你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure 上 AI 工作负荷的资源选择建议

本文为在 Azure 上运行 AI 工作负荷的组织提供了资源选择建议。 它专注于 Azure AI 平台即服务 (PaaS) 解决方案,包括 Azure AI Studio、Azure OpenAI、Azure 机器学习和 Azure AI 服务。 它涵盖了生成式和非生成式 AI 工作负荷。

在管理 AI 工作负荷时,做出明智的 AI 资源选择可使组织实现更高的性能、可伸缩性和成本效益。 下表概述了主要的 Azure AI PaaS 解决方案和重要的决策标准。

所有平台 AI 类型 说明 所需技能
Azure OpenAI 生成式 AI 用于访问 OpenAI 模型的平台 开发人员和数据科学技能
Azure AI Studio 生成式 AI 用于提示工程和部署生成式 AI 终结点的平台 开发人员和数据科学技能
Azure AI 服务 分析 AI 用于使用预生成的机器学习模型的平台 开发人员技能
Azure 机器学习 机器学习 用于训练和部署机器学习模型的平台 开发人员技能和高级数据科学技能

为生成式 AI 工作负荷选择资源

生成式 AI 需要结合不同的资源,根据输入数据进行处理并生成有意义的输出。 适当的选择可确保生成式 AI 应用程序(如使用检索增强生成 (RAG) 的应用程序)能够通过建立 AI 模型来交付准确的结果。

显示了生成式 AI 工作负荷基本组件的示意图。

在典型的 RAG 工作负荷中,(1) 工作负荷可接收用户查询。 (2) 提示流、语义内核或 LangChain 等业务流程协调程序负责管理数据流。 (3) 搜索和检索机制可找到适当的 (4) 基础数据,并将其发送给生成式 AI 终结点。 (5) 生成式 AI 模型终结点可根据用户查询和基础数据来生成响应。 将以下建议作为构建生成性 RAG 工作负荷的框架。

  • 选择生成式 AI 平台。 使用 Azure OpenAI 或 Azure AI Studio 来部署和管理生成式人工 AI。 Azure OpenAI 服务提供对 OpenAI 模型 专用网络和内容筛选的访问权限。 Azure AI Studio 为开发 AI 工作负荷提供了一个代码优先平台。 它带有用于生成和部署应用程序的内置工具。 它还具有庞大的模型目录、提示流、微调、内容安全筛选器等功能。

  • 选择适当的 AI 计算类型。 Azure AI Studio 需要使用计算实例,以便在工作室内实现提示流、创建索引和打开 Visual Studio Code(Web 或桌面)。 根据性能和预算需求来选择计算类型。

  • 选取业务流程协调程序。 常用的生成式 AI 业务流程协调程序包括语义内核提示流LangChain。 语义内核与 Azure 服务集成。 LangChain 提供超越 Microsoft 生态系统的可扩展性。

  • 挑选一个搜索和知识检索机制。 为建立生成式 AI 模型,应创建一个索引或矢量数据库,以便进行相关数据检索。 使用 Azure AI 搜索从各种数据源中生成传统索引和矢量索引,应用数据分块,并使用多种查询类型。 如果数据驻留在结构化数据库中,请考虑使用 Azure Cosmos DBAzure Database for PostgreSQLAzure Cache for Redis

  • 为基础数据选择一个数据源。 对于图像、音频、视频或大型数据集,可将基础数据存储在 Azure Blob 存储中。 或者,使用 Azure AI 搜索矢量数据库支持的数据库。

  • 挑选一个计算平台。 使用 Azure 计算决策树为工作负荷选择合适的平台。

为非生成式 AI 工作负荷选择资源

非生成式 AI 工作负荷依赖平台、计算资源、数据源和数据处理工具来为机器学习任务提供支持。 选择合适的资源,就能使用预生成和自定义解决方案来生成 AI 工作负荷。

显示了非生成式 AI 工作负荷基本组件的示意图。

在非生成式 AI 工作负荷中,(1) 工作负荷会引入数据。 (2) 可选的数据处理机制可提取或处理传入的数据。 (3) AI 模型终结点会对数据进行分析。 (4) 数据支持 AI 模型的训练或微调。 将以下建议作为构建非生成性 AI 工作负荷的框架。

  • 选择非生成式 AI 平台。Azure AI 服务提供预生成的 AI 模型,而无需数据科学技能。 有关选择合适的 Azure AI 服务的指导,请参阅选择 Azure AI 服务技术Azure 机器学习提供了一个平台,它可使用你自己的数据来生成机器学习模型,并在 AI 工作负荷中使用这些模型。

  • 选择合适的 AI 计算。 对于 Azure 机器学习,你需要使用计算资源来运行作业或托管终结点。 使用符合性能和预算需求的计算类型。 Azure AI 服务不需要使用计算资源。

  • 挑选一个数据源。 对于 Azure 机器学习,请使用支持的数据源之一来托管你的训练数据。 就 Azure AI 服务而言,许多服务都不需要对数据进行微调,而有些服务(如 Azure AI 自定义视觉)还提供将本地文件上传到托管数据存储解决方案的选项。

  • 挑选一个计算平台。 使用 Azure 计算决策树来选择合适的工作负荷平台。

  • 挑选一个数据处理服务(可选)。 Azure Functions 是一种常见的数据处理选择,因为它提供了一种无服务器选项。 Azure 事件网格也是启动数据处理管道的常用触发机制。

下一步