Verificação de conhecimento
Nota
Para completar este exercício, leia o estudo de caso a seguir. No final, ser-lhe-á pedido que dê conselhos respondendo às perguntas de verificação de conhecimentos.
Bem-vindo ao Proseware! Você é contratado como cientista de dados líder para nos ajudar a projetar uma solução de treinamento de aprendizado de máquina.
Entenda o problema
Na Proseware, estamos a desenvolver uma aplicação móvel que ajuda os médicos a diagnosticar doenças nos pacientes mais rapidamente. Um médico pode inserir os dados médicos do paciente no aplicativo para obter um diagnóstico sobre o paciente.
Nosso primeiro recurso planejado é que o aplicativo diga ao médico se o paciente deve ser rastreado ou tratado para diabetes.
Já foram coletados dados que se correlacionam com o diabetes, como número de gestações, idade e índice de massa corporal (IMC). Também temos uma equipe de cientistas de dados trabalhando no treinamento de um modelo que pode classificar se um paciente tem probabilidade de ter diabetes.
Precisamos de sua ajuda para decidir como treinar e implantar o modelo para integrá-lo ao nosso aplicativo móvel.
Considere os requisitos
Em conversas com sua equipe de cientistas de dados, você aprendeu as seguintes coisas a serem levadas em consideração:
- Considere a equipe: você tem uma equipe de cientistas de dados que estão familiarizados com o treinamento de um modelo de classificação. Eles estão acostumados a trabalhar com Python e não têm experiência com SQL ou Spark.
- Considere as ferramentas preferidas: sua equipe prefere não usar uma interface do usuário. Você quer que seus cientistas de dados treinem o modelo com cadernos e scripts. Quando somos auditados, precisamos mostrar exatamente como um modelo é treinado. Você também quer que seus cientistas de dados tenham controle total sobre como um modelo é treinado.
- Considere a computação: você quer que nossos cientistas de dados comecem a usar os notebooks Jupyter, que é com o que eles estão familiarizados.
Falou também com os utilizadores finais, nomeadamente os médicos:
-
Considere a frequência. O plano é que um médico insira as informações de um paciente no aplicativo, como sua idade e IMC. Uma vez que um médico insere a informação, ele pode selecionar o botão, após o
Analyze
qual o modelo deve prever se um paciente é provável ou não ter diabetes. - Considere o cálculo. Uma consulta médica normalmente leva menos de 10 minutos. Se queremos que os médicos usem este aplicativo, precisamos que as respostas sejam devolvidas o mais rápido possível. O modelo implantado deve estar sempre disponível, pois não sabemos quando um médico quer usá-lo.
- Considere o tamanho. Um médico só usa o aplicativo para obter uma previsão sobre a situação de um indivíduo. Não há necessidade de gerar as previsões de vários pacientes ao mesmo tempo.