了解业务问题
假设你在 Proseware 工作,这是一家专注于帮助医疗保健从业者在工作中取得更大成功的初创公司。 为了帮助执业医生,此公司正在开发一个新的 Web 应用程序,用于帮助他们根据医疗信息更快地诊断患者。
糖尿病分类模型已训练完成,已可供用于与 Web 应用集成。 Proseware 的一个重要长期目标是在未来不断改进应用并提高模型的准确性。
你以机器学习工程师的身份加入了团队,你的任务是对模型与应用的持续集成进行标准化。 标准化的一个重要方面是确保已验证用于训练模型的代码。
若要验证用于训练糖尿病分类模型的代码,你需要运行:
- Lint 分析:检查 Python 或 R 脚本中是否有任何编程或风格错误。
- 单元测试:检查代码内容的性能。
为了帮助数据科学团队了解代码质量标准,允许他们在 Visual Studio Code 中本地开发时验证他们的代码。
但是,你希望自动执行代码验证,检查推送到生产的所有代码是否没有问题并且是否按预期工作。 与数据科学团队一起,你决定在使用 GitHub Actions 创建拉取请求时运行 Lint 分析和单元测试。