了解业务问题
Proseware 是一家年轻的初创公司,旨在改善医疗保健。 Proseware 的一个团队正在开发一个新的 Web 应用程序,这将帮助执业医生更快地诊断患者。 研究表明,糖尿病是常见诊断之一,当患者医疗数据中出现了某种特定模式时就很容易检测出来。
若要推出新的 Web 应用来帮助执业医生诊断患者,在此应用中第一个要推出的功能就是糖尿病检测器。 此功能将使执业医生能够从患者处收集医疗数据、将它填写在应用中,并了解患者是否很有可能患有糖尿病。 执业医生将使用这些见解及他们的专业知识来为患者提供后续的建议。
数据科学团队创建了一个分类模型,该模型可以根据匿名数据准确预测某人是否患有糖尿病。 模型训练是在 Jupyter 笔记本中定义的。 现在,作为一名机器学习工程师,你可以从数据科学团队那里接手工作并投入到生产中。
若要操作模型,你需要:
- 将模型训练转换为可靠且可重现的管道。
- 在开发环境中测试代码和模型。
- 在生产环境中部署模型。
- 自动化端到端过程。
虽然 Jupyter 笔记本非常适合用于试验,但它不适合生产工作负载。 你的第一个任务是将笔记本转换为脚本并将模型训练作为 Azure 机器学习作业运行,以便可以轻松触发和自动化工作流。