ビジネス上の問題を把握する
Proseware の機械学習エンジニアとして、あなたは多くの技術関係者と共同作業を行います。 糖尿病分類モデルをトレーニングしたデータ サイエンス チームとの協力に続いて、そのモデルを使用する (医師が使用する) Web アプリケーションを担当するソフトウェア開発者と協力します。
新しい要件に適応するため、時間が経てば Web アプリは更新されます。同様に、モデルも時間と共に変化することが予想されます。 "データ ドリフト" や "モデルのパフォーマンス" の低下が発生するたびに、データ サイエンス チームはモデルを修正し、それに応じてコードを更新するように求められます。
モデルの変更が必要になるたびに、データ サイエンス チームはモデルの実験、テスト、パッケージ化を行う必要があります。 新しいモデルや改善されたモデルの作業を行っている間、Web アプリを使用する医師のエクスペリエンスを安定させておくため、運用環境のモデルは変更されないようにする必要があります。
機械学習エンジニアであるあなたは、データ科学者向けに機能ベースの開発を設定する必要があります。 ソース管理のブランチを操作することで、運用コードが含まれるメイン ブランチを保護し、データ科学者が自分のブランチで安全に実験できるようにします。
機能ベースの開発を設定するため、次のことを行います。
- メイン ブランチへの直接プッシュをブロックします。
- コードの更新が必要な場合は常に pull request を使用します。
- pull request が作成されるたびにコード品質チェックをトリガーし、コードを自動的に検証します。
- 変更が手動で承認された場合にのみ、pull request をマージします。