Określenie problemu biznesowego
Wyobraź sobie, że pracujesz w Proseware, start-up koncentruje się na pomaganiu lekarzom opieki zdrowotnej być bardziej skuteczne w ich pracy. Aby pomóc lekarzom, opracowywana jest nowa aplikacja internetowa, która ułatwia szybsze diagnozowanie pacjentów na podstawie informacji medycznych.
Model klasyfikacji cukrzycy jest trenowany i gotowy do zintegrowania z aplikacją internetową. Ważnym długoterminowym celem proseware jest ciągłe ulepszanie aplikacji i dokładności modelu w przyszłości.
Dołączyłeś do zespołu jako inżynier uczenia maszynowego i poproszono Cię o standaryzację ciągłej integracji modelu z aplikacją. Jednym z ważnych aspektów standaryzacji jest upewnienie się, że kod używany do trenowania modelu jest weryfikowany.
Aby sprawdzić kod używany do trenowania modelu klasyfikacji cukrzycy, należy uruchomić następujące polecenie:
- Linting: Sprawdzanie pod kątem błędów programowych lub stylistycznych w skryptach języka Python lub R.
- Testowanie jednostkowe: sprawdzanie wydajności zawartości kodu.
Aby pomóc zespołowi ds. nauki o danych zrozumieć standardy jakości kodu, będą mogli zweryfikować swój kod podczas tworzenia kodu lokalnie w programie Visual Studio Code.
Jednak chcesz zautomatyzować weryfikację kodu, aby sprawdzić, czy cały kod wypchnięty do środowiska produkcyjnego nie ma problemów i działa zgodnie z oczekiwaniami. Wraz z zespołem nauki o danych decydujesz się uruchamiać linting i testowanie jednostkowe za każdym razem, gdy żądanie ściągnięcia zostanie utworzone przy użyciu funkcji GitHub Actions.