從實際執行環境中的模型收集資料
適用於:Azure CLI ml 延伸模組 v2 (目前)Python SDK azure-ai-ml v2 (目前)
在本文中,您會了解如何從部署至 Azure Machine Learning 線上端點的模型收集資料。
Azure Machine Learning 資料收集器提供從部署到受控線上端點或 Kubernetes 線上端點的模型中輸入和輸出資料的即時記錄。 Azure Machine Learning 會將記錄的推斷資料儲存在 Azure Blob 儲存體中。 然後,即可將此資料順暢地用於模型監測、偵錯或稽核,進而讓您可檢視已部署模型的效能。
資料收集器提供:
- 將推斷資料記錄到中央位置 (Azure Blob 儲存體)
- 支援受控線上端點與 Kubernetes 線上端點
- 部署層級的定義,允許對其組態進行最大變更
- 支援承載和自訂記錄
記錄模式
資料收集器提供兩種記錄模式:承載記錄和自訂記錄。 承載記錄可讓您從已部署的模型收集 HTTP 要求並回應承載資料。 Azure Machine Learning 會使用自訂記錄為您提供 Python SDK,讓您直接從評分指令碼記錄 pandas DataFrames。 除了任何資料轉換 (或前置處理) 之前、期間及之後的資料之外,您來可以使用自訂記錄 Python SDK 來記錄模型輸入和輸出資料。
資料收集器組態
您可以在部署層級設定資料收集器,並在部署時間指定組態。 您可以設定將接收所收集資料的 Azure Blob 儲存體目的地。 您也可以設定所要收集資料的取樣率 (範圍從 0 – 100%)。
限制
資料收集器具有下列限制:
- 資料收集器僅支援記錄線上 (或即時) Azure Machine Learning 端點 (受控或 Kubernetes)。
- 資料收集器 Python SDK 僅支援透過 Pandas DataFrames 記錄表格式資料。