了解商務問題
假設您是 Proseware 的機器學習工程師,這是一家開發新醫療保健應用程式的新創公司。 資料科學家所建立的糖尿病分類模型即是要與應用程式整合的第一個模型。 在您與較大的小組交談後,得出的結果是要讓多個模型與 Web 應用程式整合。
而在糖尿病分類模型證明成功後,Proseware 想要新增更多機器學習模型,以便醫生可以更快速地診斷各種疾病的患者。 對於每個新模型,資料科學小組都必須要在安全的環境中進行實驗。 一旦新模型正確度足夠且能夠與 Web 應用程式整合,就應該先進行測試,再將其部署至從 Web 應用程式呼叫的端點。
您與小組一起做出決定,使用不同的環境:
- 用於實驗的開發環境。
- 用於測試的預備環境。
- 用於將模型部署至生產端點的實際執行環境。
在每個環境中,您將建立個別的 Azure Machine Learning 工作區。 藉由分開每個環境的工作區,您將能夠保護資料和資源。 例如,開發環境工作區不會含有任何病患的個人資料。 而且資料科學家只能存取開發環境工作區,因為他們只需要測試環境,而且不需要存取任何生產程式碼或資源。
身為機器學習工程師,您必須確保資料科學家所建置的任何專案都能輕鬆地跨環境移動。 一旦準備好部署新的模型後,您即會想要在預備環境中訓練與測試模型。 測試程式碼、模型和部署之後,請在實際執行環境中部署模型。 此流程的各個部分可以自動化以加速流程。
若要使用環境,您會需要:
- 在 GitHub 存放庫中建立環境。
- 將認證儲存至每個 Azure Machine Learning 工作區,作為 GitHub 中的環境祕密。
- 將必要的檢閱者新增至環境以進行閘道核准。
- 在 GitHub Actions 工作流程中使用環境。