你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
教程:在 Azure 容器应用中使用无服务器 GPU 生成映像(预览版)
本文介绍如何创建使用无服务器 GPU 为 AI 应用程序提供支持的容器应用。
使用无服务器 GPU 时,可以直接访问 GPU 计算资源,而无需执行手动基础结构配置,例如安装驱动程序。 只需部署 AI 模型的映像。
本教程介绍以下内容:
- 创建新的容器应用和环境
- 将环境配置为使用无服务器 GPU
- 将应用部署到 Azure 容器应用
- 使用新的无服务器 GPU 启用应用程序
- 启用项目流式处理以减少 GPU 冷启动
先决条件
资源 | 说明 |
---|---|
Azure 帐户 | 需要一个具有活动订阅的 Azure 帐户。 如果没有帐户,可以免费创建一个。 |
Azure 容器注册表实例 | 需要现有的 Azure 容器注册表实例或创建实例的权限。 |
访问无服务器 GPU | 只有在请求 GPU 配额后,才能访问 GPU。 可以通过客户支持案例提交 GPU 配额请求。 |
创建容器应用
转到 Azure 门户,搜索并选择“容器应用”。
选择“创建”,然后选择“容器应用”。
在“基本信息”窗口中,在每个部分中输入以下值。
在“项目详细信息”下输入以下值:
设置 值 订阅 选择 Azure 订阅。 资源组 选择“新建”并输入“my-gpu-demo-group”。 容器应用名称 输入“my-gpu-demo-app”。 部署源 选择“容器映像”。 在“容器应用环境”下输入以下值:
设置 值 区域 选择“美国西部 3”。
有关更多受支持的区域,请参阅在 Azure 中使用无服务器 GPU。容器应用环境 选择新建。 在“创建容器应用环境”窗口中,输入以下值:
设置 值 环境名称 输入“my-gpu-demo-env”。 选择创建。
选择“下一步: 容器 >”。
在“容器”窗口中,输入以下值:
设置 值 名称 输入“my-gpu-demo-container”。 映像源 选择“Docker Hub 或其他注册表”。 图像类型 选择“公共”。 注册表登录服务器 输入 mcr.microsoft.com。 映像和标记 输入“k8se/gpu-quickstart:latest”。 工作负载配置文件 选择以“消耗 - 最多 4”开头的选项... GPU 选中 复选框。 GPU 类型 选择“T4”选项,然后选择将配置文件添加到环境的链接。 选择“下一步: 流入量 >”。
在“流入量”窗口中,输入以下值:
设置 “值” 流入量 选中“已启用”复选框。 入口流量 选择“接受来自任意位置的流量”单选按钮。 目标端口 输入 80。 选择“查看 + 创建”。
选择“创建”。
等待部署完成,然后选择“转到资源”。
此过程可能需要五分钟才能完成。
使用 GPU 应用
在“概述”窗口中,选择“应用程序 URL”链接,在浏览器中打开 Web 应用前端并使用 GPU 应用程序。
注意
- 若要实现 GPU 应用的最佳性能,请按照以下步骤改进无服务器 GPU 的冷启动。
- 当应用程序中有多个容器时,第一个容器可以访问 GPU。
监视 GPU
生成映像后,使用以下步骤查看 GPU 处理的结果:
在 Azure 门户中打开容器应用。
在“监视”部分中,选择“见解”。
选择副本。
选择你的容器。
选择*“重新连接”。
在“选择启动命令”窗口中选择“/bin/bash”,然后选择“连接”。
设置 shell 后,输入命令 nvidia-smi 以查看 GPU 的状态和输出。
清理资源
本教程中创建的资源会影响 Azure 帐单。
如果不打算长期使用这些服务,请按照步骤删除本教程中创建的所有内容。
在 Azure 门户中,搜索并选择“资源组”。
选择“my-gpu-demo-group”。
选择“删除资源组”。
在确认框中,输入“my-gpu-demo-group”。
选择“删除”。