了解业务问题
你就职于 Proseware,这是一家年轻的初创公司,旨在改善医疗保健。 你最近与数据科学团队一起完成了糖尿病分类模型的操作工作。 换句话说,你已将笔记本转换为可以作为 Azure 机器学习作业执行的脚本。
在向 Proseware 的业务和技术利益干系人展示端到端解决方案期间,从模型创建的角度以及使用的角度来看,在如何扩展此模型的使用范围方面出现了几个问题。
在医疗保健中,许多模型使用患者的医疗数据来预测疾病。 从以前的项目中,我们了解到,这些模型通常高度依赖于模型训练所基于的人口的地理位置。 若要使此模型可缩放,我们需要确保可以根据不同的数据段自动训练不同版本的模型。
会议期间,业务和技术利益干系人决定实施“机器学习操作(MLOps)”策略,以便快速创建、更新和部署数据科学团队为从业者 Web 应用开发的分类模型等模型。
由于 Proseware 使用 GitHub 对其代码进行版本控制,因此决定使用 GitHub Actions 作为 MLOps 策略的自动化组件。
实现自动化过程的第一步是开发 GitHub Action,以使用 Azure 机器学习作业训练糖尿病分类模型。
若要创建 GitHub Action 以使用 Azure 机器学习计算触发模型训练,需要:
- 使用 Azure CLI 创建服务主体。
- 将服务主体的凭据存储为 GitHub 中的机密。
- 创建 GitHub Action,以使用 Azure 机器学习计算训练模型。