從 Azure Databricks 外部存取 MLflow 追蹤伺服器
您不妨從自己的應用程式或 MLflow CLI 登入 MLflow 追蹤伺服器。
本文說明所需的設定步驟。 首先安裝 MLflow 並設定您的 credentials (步驟 1)。 然後,您可以設定應用程式 (步驟 2) 或設定 MLflow CLI (步驟 3)。
如需如何啟動和記錄至開放原始碼追蹤伺服器的資訊,請參閱 MLflow 開放原始碼文件。
步驟 1:設定環境
如果您沒有 Azure Databricks 帳戶,可以免費試用 Databricks。
若要為存取 Azure Databricks 託管的 MLflow 追蹤伺服器設定環境:
- 使用
pip install mlflow
安裝 MLflow。 - 設定驗證。 執行下列其中一項:
Generate REST API 令牌,並使用
databricks configure --token
建立 credentials 檔案。透過環境變數指定 credentials:
# Configure MLflow to communicate with a Databricks-hosted tracking server export MLFLOW_TRACKING_URI=databricks # Specify the workspace hostname and token export DATABRICKS_HOST="..." export DATABRICKS_TOKEN="..."
步驟 2:設定 MLflow 應用程式
如果您透過建立 credentials 檔案時透過 --profile
指定配置檔名稱,請將 MLflow 應用程式設定為記錄至 Azure Databricks,將追蹤 URI 設定為 databricks
或 databricks://<profileName>
。 例如,將 MLFLOW_TRACKING_URI
環境變數設定為「databricks」即可完成。
步驟 3:設定 MLflow CLI
將 MLflow CLI 設定為使用 MLFLOW_TRACKING_URI
環境變數與 Azure Databricks 追蹤伺服器通訊。 例如,若要使用 CLI 搭配追蹤 URI databricks
建立實驗,請執行:
# Replace <your-username> with your Databricks username
export MLFLOW_TRACKING_URI=databricks
mlflow experiments create -n /Users/<your-username>/my-experiment