Het zakelijke probleem begrijpen

Voltooid

Stel dat u bij Proseware werkt, een start-up die is gericht op het helpen van zorgverleners om succesvoller te zijn in hun werk. Om beoefenaars te helpen, wordt een nieuwe webtoepassing ontwikkeld om patiënten sneller te diagnosticeren op basis van medische informatie.

Een diabetesclassificatiemodel is getraind en klaar om te worden geïntegreerd met de web-app. Een belangrijk langetermijndoel van Proseware is het continu verbeteren van de app en de nauwkeurigheid van het model in de toekomst.

U bent lid van het team als machine learning-engineer en wordt gevraagd om de continue integratie van het model met de app te standaardiseren. Een belangrijk aspect van standaardisatie is ervoor te zorgen dat de code die wordt gebruikt om het model te trainen, wordt geverifieerd.

Als u de code wilt controleren die wordt gebruikt voor het trainen van het diabetesclassificatiemodel, moet u het volgende uitvoeren:

  • Linting: Controleren op programmatische of stilistische fouten in Python- of R-scripts.
  • Eenheidstests: Controleren op de prestaties van de inhoud van de code.

Om het data science-team inzicht te geven in de kwaliteitsnormen voor code, kunnen ze hun code verifiëren bij het lokaal ontwikkelen in Visual Studio Code.

U wilt de codeverificatie echter automatiseren om te controleren of alle code die naar productie is gepusht, geen problemen heeft en werkt zoals verwacht. Samen met het data science-team besluit u linting en eenheidstests uit te voeren wanneer een pull-aanvraag wordt gemaakt met behulp van GitHub Actions.