Compreender o problema do negócio
A Proseware é uma start-up jovem, com o objetivo de melhorar os cuidados de saúde. Uma equipa da Proseware está a trabalhar numa nova aplicação Web que ajudará os profissionais a diagnosticar os pacientes mais rapidamente. A pesquisa mostrou que o diabetes é um dos diagnósticos que é comum, e facilmente detetado quando um determinado padrão nos dados médicos de um paciente é evidente.
Para lançar o novo aplicativo web para profissionais que os ajudará no diagnóstico de pacientes, o primeiro recurso a ser implementado no aplicativo é um detetor de diabetes. O recurso permitirá que um profissional colete dados médicos de um paciente, preencha-os no aplicativo e saiba se há uma grande chance de esse paciente ter diabetes sim ou não. Os profissionais utilizarão esses conhecimentos com os seus conhecimentos especializados para aconselhar os seus pacientes sobre os próximos passos.
A equipe de ciência de dados criou um modelo de classificação que prevê com precisão se alguém tem diabetes ou não com base em dados anonimizados. O modelo de treinamento é definido em um caderno Jupyter. Agora cabe a você, como engenheiro de aprendizado de máquina, pegar o trabalho da equipe de ciência de dados e trazê-lo para a produção.
Para operacionalizar o modelo, você vai querer:
- Converta o treinamento do modelo em um pipeline robusto e reproduzível .
- Teste o código e o modelo em um ambiente de desenvolvimento .
- Implante o modelo em um ambiente de produção .
- Automatize o processo de ponta a ponta.
Embora um notebook Jupyter seja ideal para experimentação, ele não é adequado para cargas de trabalho de produção. Sua primeira tarefa será converter os blocos de anotações em scripts e executar o treinamento de modelo como um trabalho do Azure Machine Learning, para que o fluxo de trabalho possa ser facilmente acionado e automatizado.