剧集
AKS Ep02 上的智能应用:使用 Kaito 将自己的 AI 模型引入 AKS 上的智能应用
替换为 Paul Yu, Ishaan Sehgal, Steven Murawski
请加入我们,了解如何使用 Kubernetes AI 工具链操作器 (KAITO) 在 AKS 群集中运行具有基于 HTTP 的推理终结点的开源大型语言模型 (LLM)。 我们将逐步介绍在 GPU 节点池上设置和部署容器化 LLM,并了解 KAITO 如何帮助减轻预配 GPU 节点和优化模型部署参数以适应 GPU 配置文件的操作负担。
学习目标
- 了解如何使用 AI 功能扩展现有微服务。
- 了解如何使用渐进式增强在现有应用程序中集成 AI 功能。
- 了解如何将开源或自定义大型语言模型 (LLM) 与现有应用程序结合使用。
- 了解如何在 Azure Kubernetes 服务上运行开源或自定义大型语言模型
章节
- 00:00 - 简介
- 02:40 - 学习目标
- 04:35 - 演示 - 部署 Aks 应用商店演示应用
- 11:00 - AKS 上的 AI 工作负载
- 15:53 - AKS 上的 AI 和 ML
- 34:40 - 什么是 Kaito?
- 42:03 - BYO 模型的挑战
- 44:49 - 演示
- 01:16:04 - 摘要
推荐的资源
相关剧集
- 完整系列: 实时学习:AKS 上的智能应用
连接
- Paul Yu |LinkedIn: /in/yupaul
- Ishaan Sehgal |LinkedIn: /in/ishaan-sehgal
- 史蒂文·穆拉夫斯基 |Twitter: @StevenMurawski |LinkedIn: /in/usepowershell
请加入我们,了解如何使用 Kubernetes AI 工具链操作器 (KAITO) 在 AKS 群集中运行具有基于 HTTP 的推理终结点的开源大型语言模型 (LLM)。 我们将逐步介绍在 GPU 节点池上设置和部署容器化 LLM,并了解 KAITO 如何帮助减轻预配 GPU 节点和优化模型部署参数以适应 GPU 配置文件的操作负担。
学习目标
- 了解如何使用 AI 功能扩展现有微服务。
- 了解如何使用渐进式增强在现有应用程序中集成 AI 功能。
- 了解如何将开源或自定义大型语言模型 (LLM) 与现有应用程序结合使用。
- 了解如何在 Azure Kubernetes 服务上运行开源或自定义大型语言模型
章节
- 00:00 - 简介
- 02:40 - 学习目标
- 04:35 - 演示 - 部署 Aks 应用商店演示应用
- 11:00 - AKS 上的 AI 工作负载
- 15:53 - AKS 上的 AI 和 ML
- 34:40 - 什么是 Kaito?
- 42:03 - BYO 模型的挑战
- 44:49 - 演示
- 01:16:04 - 摘要
推荐的资源
相关剧集
- 完整系列: 实时学习:AKS 上的智能应用
连接
- Paul Yu |LinkedIn: /in/yupaul
- Ishaan Sehgal |LinkedIn: /in/ishaan-sehgal
- 史蒂文·穆拉夫斯基 |Twitter: @StevenMurawski |LinkedIn: /in/usepowershell
视频 URL
HTML iframe
想提供反馈? 在此处提交问题。