你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

从 GitHub 模型升级到 Azure AI 模型推理服务

如果要开发生成式 AI 应用程序,则可以使用 GitHub 模型免费查找和试验 AI 模型。 操场和免费 API 使用受到每分钟请求数、每天请求数、每个请求的令牌数和并发请求数的速率限制。 如果受到速率限制,则需要等待命中的速率限制重置,然后才能发出更多请求。

准备好将应用程序引入生产环境后,可以通过在 Azure 订阅中部署 Azure AI 服务资源并开始使用 Azure AI 模型推理服务来升级体验。 不需要更改代码中的其他任何内容。

以下文章介绍如何开始使用适用于 Azure AI 服务的 Azure AI 模型中的 GitHub 模型。

先决条件

要完成本教程,您需要:

  • 有权访问 GitHub 模型的 GitHub 帐户。

  • Azure 订阅。 如果没有帐户,系统会提示在准备好将模型部署到生产环境时创建或更新 Azure 帐户以即用即付帐户。

升级到 Azure AI 服务

操场和免费 API 使用的速率限制旨在帮助你试验模型并开发 AI 应用程序。 准备好将应用程序引入生产环境后,请使用付费 Azure 帐户中的密钥和终结点。 不需要更改代码中的其他任何内容。

若要获取密钥和终结点,请执行以下操作:

  1. 在模型的操场中,选择“获取 API 密钥”

  2. 选择“获取生产密钥”

  3. 如果没有 Azure 帐户,请选择“创建我的帐户”,然后按照步骤创建一个帐户。

  4. 如果有 Azure 帐户,请选择“登录”

  5. 如果现有帐户是免费帐户,则首先必须升级到即用即付计划。 升级后,返回到操场并再次选择“获取 API 密钥”,然后使用升级后的帐户登录。

  6. 登录到 Azure 帐户后,会转到 Azure AI Foundry

  7. 在页面顶部,选择“转到 GitHub AI 资源”转到 Azure AI Foundry / Github](https://ai.azure.com/github)。 在 Azure AI Foundry 门户中加载初始模型详细信息可能需要一两分钟。

  8. 页面将加载模型的详细信息。 选择“创建部署”按钮,将模型部署到帐户。

  9. 部署后,模型 API 密钥和终结点会显示在概述中。 在代码中使用这些值,以在生产环境中使用该模型。

    显示如何获取与部署关联的 URL 和密钥的屏幕截图。

此时,所选的模型可供使用。

提示

使用参数 model="<deployment-name> 将请求路由到此部署。 部署在某些配置下充当给定模型的别名。 请参阅“路由概念”页,了解 Azure AI 服务如何路由部署。

升级代码以使用新终结点

配置 Azure AI 服务资源后,即可开始从代码中使用它。 需要终结点 URL 和密钥,可在“概述”部分找到:

屏幕截图显示了如何获取与资源关联的 URL 和密钥。

可以使用任何受支持的 SDK 从终结点中获取预测。 正式支持以下 SDK:

  • OpenAI SDK
  • Azure OpenAI SDK
  • Azure AI 推理 SDK

有关更多详细信息和示例,请参阅支持的语言和 SDK 部分。 以下示例演示如何将 Azure AI 模型推理 SDK 与新部署的模型配合使用:

使用包管理器(例如 pip)安装包 azure-ai-inference

pip install azure-ai-inference>=1.0.0b5

警告

Azure AI 服务资源需要 Python 版本 azure-ai-inference>=1.0.0b5

然后,可以使用包来使用模型。 以下示例演示如何创建客户端来使用聊天补全:

import os
from azure.ai.inference import ChatCompletionsClient
from azure.core.credentials import AzureKeyCredential

client = ChatCompletionsClient(
    endpoint=os.environ["AZUREAI_ENDPOINT_URL"],
    credential=AzureKeyCredential(os.environ["AZUREAI_ENDPOINT_KEY"]),
)

浏览我们的示例,并阅读 API 参考文档以开始使用。

生成第一个聊天补全:

from azure.ai.inference.models import SystemMessage, UserMessage

response = client.complete(
    messages=[
        SystemMessage(content="You are a helpful assistant."),
        UserMessage(content="Explain Riemann's conjecture in 1 paragraph"),
    ],
    model="mistral-large"
)

print(response.choices[0].message.content)

探索更多功能

Azure AI 模型推理支持在 GitHub 模型中不可用的更多功能,包括:

遇到麻烦?

请参阅“常见问题解答”部分 ,了解更多帮助。

后续步骤