你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

教程:在 Azure 容器应用中使用无服务器 GPU 生成映像(预览版)

本文介绍如何创建使用无服务器 GPU 为 AI 应用程序提供支持的容器应用。

使用无服务器 GPU 时,可以直接访问 GPU 计算资源,而无需执行手动基础结构配置,例如安装驱动程序。 只需部署 AI 模型的映像。

本教程介绍以下内容:

  • 创建新的容器应用和环境
  • 将环境配置为使用无服务器 GPU
  • 将应用部署到 Azure 容器应用
  • 使用新的无服务器 GPU 启用应用程序
  • 启用项目流式处理以减少 GPU 冷启动

先决条件

资源 说明
Azure 帐户 需要一个具有活动订阅的 Azure 帐户。 如果没有帐户,可以免费创建一个
Azure 容器注册表实例 需要现有的 Azure 容器注册表实例或创建实例的权限。
访问无服务器 GPU 只有在请求 GPU 配额后,才能访问 GPU。 可以通过客户支持案例提交 GPU 配额请求。

创建容器应用

  1. 转到 Azure 门户,搜索并选择“容器应用”

  2. 选择“创建”,然后选择“容器应用”。

  3. 在“基本信息”窗口中,在每个部分中输入以下值。

    在“项目详细信息”下输入以下值:

    设置
    订阅 选择 Azure 订阅。
    资源组 选择“新建”并输入“my-gpu-demo-group”
    容器应用名称 输入“my-gpu-demo-app”
    部署源 选择“容器映像”

    在“容器应用环境”下输入以下值

    设置
    区域 选择“美国西部 3”。

    有关更多受支持的区域,请参阅在 Azure 中使用无服务器 GPU
    容器应用环境 选择新建

    在“创建容器应用环境”窗口中,输入以下值

    设置
    环境名称 输入“my-gpu-demo-env”

    选择创建

    选择“下一步: 容器 >”

  4. 在“容器”窗口中,输入以下值:

    设置
    名称 输入“my-gpu-demo-container”
    映像源 选择“Docker Hub 或其他注册表”。
    图像类型 选择“公共”
    注册表登录服务器 输入 mcr.microsoft.com
    映像和标记 输入“k8se/gpu-quickstart:latest”
    工作负载配置文件 选择以“消耗 - 最多 4”开头的选项...
    GPU 选中 复选框。
    GPU 类型 选择“T4”选项,然后选择将配置文件添加到环境的链接。

    选择“下一步: 流入量 >”

  5. 在“流入量”窗口中,输入以下值:

    设置 “值”
    流入量 选中“已启用”复选框。
    入口流量 选择“接受来自任意位置的流量”单选按钮。
    目标端口 输入 80
  6. 选择“查看 + 创建”。

  7. 选择“创建”。

  8. 等待部署完成,然后选择“转到资源”

    此过程可能需要五分钟才能完成。

使用 GPU 应用

在“概述”窗口中,选择“应用程序 URL”链接,在浏览器中打开 Web 应用前端并使用 GPU 应用程序。

注意

  • 若要实现 GPU 应用的最佳性能,请按照以下步骤改进无服务器 GPU 的冷启动
  • 当应用程序中有多个容器时,第一个容器可以访问 GPU。

监视 GPU

生成映像后,使用以下步骤查看 GPU 处理的结果:

  1. 在 Azure 门户中打开容器应用。

  2. 在“监视”部分中,选择“见解”。

  3. 选择副本。

  4. 选择你的容器。

  5. 选择*“重新连接”。

  6. 在“选择启动命令”窗口中选择“/bin/bash”,然后选择“连接”

  7. 设置 shell 后,输入命令 nvidia-smi 以查看 GPU 的状态和输出。

清理资源

本教程中创建的资源会影响 Azure 帐单。

如果不打算长期使用这些服务,请按照步骤删除本教程中创建的所有内容。

  1. 在 Azure 门户中,搜索并选择“资源组”

  2. 选择“my-gpu-demo-group”

  3. 选择“删除资源组”

  4. 在确认框中,输入“my-gpu-demo-group”

  5. 选择“删除”。

后续步骤