Porozumění obchodnímu problému
Proseware je mladý start-up, jehož cílem je zlepšit zdravotní péči. Jeden tým v Proseware pracuje na nové webové aplikaci, která odborníkům pomůže rychleji diagnostikovat pacienty. Výzkum ukázal, že diabetes je jednou z diagnostik, která je běžná, a snadno zjistit, když je zřejmé, že určitý vzor v lékařských datech pacienta.
Pokud chcete spustit novou webovou aplikaci pro odborníky, kteří jim pomůžou s diagnostikou pacientů, je první funkcí, která se má v aplikaci nasadit, detektor cukrovky. Tato funkce umožní specialistovi shromáždit zdravotní údaje od pacienta, vyplnit je v aplikaci a zjistit, jestli je vysoká pravděpodobnost, že pacient má cukrovku ano nebo ne. Odborníci budou tyto poznatky využívat se svými odbornými znalostmi k tomu, aby svým pacientům poskytli rady k dalším krokům.
Tým pro datové vědy vytvořil klasifikační model, který přesně předpovídá, jestli má někdo cukrovku nebo ne na základě anonymizovaných dat. Trénování modelu je definováno v poznámkovém bloku Jupyter. Teď je na vás jako technik strojového učení, abyste mohli pracovat od týmu datových věd a přenést ho do produkčního prostředí.
Pokud chcete model zprovoznit, budete chtít:
- Převeďte trénování modelu na robustní a reprodukovatelný kanál.
- Otestujte kód a model ve vývojovém prostředí.
- Nasaďte model v produkčním prostředí.
- Automatizujte kompletní proces.
I když je poznámkový blok Jupyter ideální pro experimentování, není vhodný pro produkční úlohy. Vaším prvním úkolem bude převést poznámkové bloky na skripty a spustit trénování modelu jako úlohu Azure Machine Learning, aby se pracovní postup mohl snadno aktivovat a automatizovat.