Entender o problema de negócios
Imagine que você está trabalhando na Proseware, uma start-up voltada para ajudar os profissionais de assistência médica a serem mais bem-sucedidos no trabalho. Para ajudar os clínicos, um novo aplicativo Web está sendo desenvolvido para ajudar a diagnosticar os pacientes mais rapidamente com base em informações médicas.
Um modelo de classificação de diabetes é treinado e está pronto para ser integrado ao aplicativo Web. Uma meta importante de longo prazo da Proseware é aprimorar continuamente o aplicativo e a precisão do modelo no futuro.
Você se juntou à equipe como um engenheiro de machine learning e foi solicitado a padronizar a integração contínua do modelo com o aplicativo. Um aspecto importante da padronização é garantir que o código usado para treinar o modelo seja verificado.
Para verificar o código usado para treinar o modelo de classificação diabetes, você vai executar:
- Lint: verificar se há erros programáticos ou estilísticos em scripts do Python ou R.
- Teste de unidade: verificar o desempenho do conteúdo do código.
Para ajudar a equipe de ciência de dados a entender os padrões de qualidade do código, eles poderão verificar o código ao desenvolver localmente no Visual Studio Code.
No entanto, você deseja automatizar a verificação de código para confirmar se todo o código enviado para a produção não tem problemas e funciona conforme o esperado. Junto com a equipe de ciência de dados, você decide executar o lint e o teste de unidade usando GitHub Actions sempre que uma solicitação de pull for criada.