剧集

AKS Ep02 上的智能应用:使用 Kaito 将自己的 AI 模型引入 AKS 上的智能应用

替换为 Paul Yu, Ishaan Sehgal, Steven Murawski

请加入我们,了解如何使用 Kubernetes AI 工具链操作器 (KAITO) 在 AKS 群集中运行具有基于 HTTP 的推理终结点的开源大型语言模型 (LLM)。 我们将逐步介绍在 GPU 节点池上设置和部署容器化 LLM,并了解 KAITO 如何帮助减轻预配 GPU 节点和优化模型部署参数以适应 GPU 配置文件的操作负担。

学习目标

  • 了解如何使用 AI 功能扩展现有微服务。
  • 了解如何使用渐进式增强在现有应用程序中集成 AI 功能。
  • 了解如何将开源或自定义大型语言模型 (LLM) 与现有应用程序结合使用。
  • 了解如何在 Azure Kubernetes 服务上运行开源或自定义大型语言模型

章节

连接

高级
解决方案架构师
DevOps 工程师
开发人员
AI 工程师
Azure Kubernetes 服务 (AKS)
Azure 虚拟机