Team 資料科學 程式生命週期的部署階段
本文概述與 Team 資料科學 Process (TDSP) 部署相關聯的目標、工作和交付專案。 此程式提供建議的生命週期,讓小組可用來建構數據科學專案。 生命週期概述小組執行的主要階段,通常是反覆執行:
- 商務理解
- 數據擷取和瞭解
- 建 模
- [部署]
- 客戶接受
以下是 TDSP 生命週期的視覺表示法:
目標
部署階段的目標是將具有數據管線的模型部署到生產環境或類似生產環境,以供最終客戶接受。
如何完成工作
此階段的主要工作是 讓模型運作。 將模型和管線部署到生產環境或類似生產環境,以取用應用程式。
讓模型運作
在您擁有一組效能良好的模型之後,您的小組就可以將其運作,讓其他應用程式取用。 根據業務需求,預測會即時或批次進行。 若要部署模型,您可以使用 API 介面來公開它們。 透過介面,使用者可以輕鬆地從各種應用程式取用模型,例如:
- 網站
- 試算表
- 儀表板
- 企業營運應用程式
- 後端應用程式
如需使用 Azure 機器學習 進行模型運作的範例,請參閱將機器學習模型部署至 Azure。 最佳做法是將監視建置至生產模型和您所部署的數據管線。 這種做法有助於後續的系統狀態報告和疑難解答。
與 MLflow 整合
為了協助支援此階段,您可以納入下列 Azure 機器學習 功能:
模型管理:若要準備部署,您可以將模型放入生產環境或操作環境。 MLflow 會管理和版本部署就緒模型,有助於改善作業化。
模型服務與部署:MLflow 的模型服務功能有助於部署程式,讓您可以輕鬆地在各種環境中提供模型。
Artifacts
在此階段中,您的小組會提供:
顯示系統健康情況和關鍵計量的狀態儀錶板 。 建議您使用Power BI來建立儀錶板。
具有部署詳細數據的最終模型報表 。
最終的解決方案架構檔。
同行審查的文學
研究人員在同行審查的文獻中發表了有關 TDSP 的研究。 引 文 提供機會來調查 TDSP 的其他應用程式或類似的想法,包括部署生命週期階段。
參與者
本文由 Microsoft 維護。 原始投稿人如下。
主要作者:
- 標記 Tabladillo |資深雲端解決方案架構師
若要查看非公開的 LinkedIn 設定檔,請登入 LinkedIn。
相關資源
這些文章說明 TDSP 生命週期的其他階段: