了解业务问题
想象一下,你是 Proseware 的一名机器学习工程师,这是一家致力于开发新医疗保健应用的年轻初创公司。 第一个与应用集成的模型是由数据科学家创建的糖尿病分类模型。 在与更大的团队交谈后,我们发现目标是让多个模型与 Web 应用集成。
当糖尿病分类模型被证明成功后,Proseware 想要添加更多的机器学习模型,以便从业者能够更快地诊断出患者的各种疾病。 对于每一个新模型,数据科学团队都需要能够在安全的环境中进行试验。 一旦新模型足够准确,可与 Web 应用集成,就应对其进行测试,然后将其部署到从 Web 应用调用的终结点。
与团队一起,你决定最好使用不同的环境:
- “开发环境”用于实验。
- “过渡环境”用于测试。
- “生产环境”用于将模型部署到生产终结点。
对于每个环境,你都将创建一个单独的 Azure 机器学习工作区。 通过将每个环境的工作区分开,将能够保护数据和资源。 例如,开发工作区不会包含来自患者的任何个人数据。 数据科学家只能访问开发工作区,因为他们只需要一个实验环境,不需要访问任何生产代码或资源。
作为一名机器学习工程师,你确实需要确保数据科学家生成的任何数据都可轻松地跨环境迁移。 准备好部署新模型后,你希望在过渡环境中对模型进行训练和测试。 在测试代码、模型和部署之后,你希望在生产环境中部署模型。 该过程的一部分可以自动化以加快该过程。
要使用环境,需要:
- 在 GitHub 存储库中创建“环境”。
- 将每个 Azure 机器学习工作区的凭据作为环境“机密”存储在 GitHub 中。
- 将“所需的审阅者”添加到环境中以进行门控审批。
- 在 GitHub Actions 工作流中使用环境。