ビジネス上の問題を把握する

完了

あなたは、新しい医療アプリに取り組んでいる設立まもないスタートアップ企業 Proseware の機械学習エンジニアであるとしましょう。 データ サイエンティストによって作成された糖尿病分類モデルは、アプリと統合される最初のモデルです。 より大きなチームと話し合った結果、複数のモデルを Web アプリに統合することを目標にしていることがわかりました。

Proseware は、糖尿病分類モデルの成功が明らかになったら、より多くの機械学習モデルを追加して、開業医がさまざまな病気の患者をより迅速に診断できるようにしたいと考えています。 データ サイエンス チームは、すべての新しいモデルについて、安全な環境で実験できる必要があります。 新しいモデルが Web アプリと統合できる十分に正確なものになったら、Web アプリから呼び出されるエンドポイントにデプロイする前にテストする必要があります。

あなたは、チームと共に、次の異なる環境を使用するのが最善であると判断しました。

  • 開発 (実験用)。
  • ステージング (テスト用)。
  • 運用 (運用エンドポイントへのモデルのデプロイ用)。

環境ごとに、個別の Azure Machine Learning ワークスペースを作成します。 各環境のワークスペースを分離することで、データとリソースを保護することができます。 たとえば、開発ワークスペースには、患者からの個人データは含まれません。 また、データ サイエンティストは、実験用の環境のみを必要とし、運用コードやリソースにアクセスする必要はないため、開発ワークスペースにのみアクセスできます。

機械学習エンジニアであるあなたは、データ サイエンティストがどんなアプリをビルドしても、それを環境間で簡単に移動できるようにする必要があります。 新しいモデルをデプロイする準備ができたら、ステージング環境でモデルをトレーニングにしてテストする必要があります。 コード、モデル、デプロイをテストした後、運用環境にモデルをデプロイする必要があります。 このプロセスの一部を自動化して、プロセスを高速化できます。

環境を使用するには、次の操作を行う必要があります。

  • GitHub リポジトリに環境を作成します。
  • 資格情報を GitHub の環境シークレットとして各 Azure Machine Learning ワークスペースに格納します。
  • ゲート承認のために、必要なレビュー担当者を環境に追加します。
  • GitHub Actions ワークフローで環境を使用します。