Správa modelů v Microsoft Fabric

8 min

Integrace MLflow v Microsoft Fabric usnadňuje sledování a správu modelů strojového učení.

Sledování artefaktů modelu pomocí MLflow

Po vytrénování modelu chcete model použít k bodování a generování nových předpovědí. Pokud chcete model snadno integrovat, musíte model uložit, abyste ho mohli načíst do jiného prostředí. Běžným přístupem je uložení modelu jako souboru pickle, serializovaného objektu.

Poznámka:

Formát uloženého modelu závisí na rozhraní strojového učení, které používáte. Například při trénování modelu hlubokého učení se můžete rozhodnout model uložit pomocí formátu Open Neural Network Exchange (ONNX).

MLflow přidá do výstupu modelu další vrstvu přidáním souboru MLmodel . Soubor MLmodel určuje metadata modelu, například jak a kdy byl model natrénován, a také očekávaný vstup a výstup modelu.

Vysvětlení souboru MLmodel

Při protokolování modelu pomocí MLflow se všechny relevantní prostředky modelu ukládají do model složky se spuštěním experimentu.

Složka model obsahuje soubor MLmodel, jediný zdroj pravdy o tom, jak se má model načíst a využívat.

Soubor MLmodel může zahrnovat:

artifact_path: Během trénování se model do této cesty zaprotokoluje.
flavor: Knihovna strojového učení, pomocí které byl model vytvořen.
model_uuid: Jedinečný identifikátor registrovaného modelu.
run_id: Jedinečný identifikátor spuštění úlohy, během kterého byl model vytvořen.
signature: Určuje schéma vstupů a výstupů modelu:
- inputs: Platný vstup do modelu. Například podmnožina trénovací datové sady.
- outputs: Platný výstup modelu. Například předpovědi modelu pro vstupní datovou sadu.

Představte si, že jste vytrénovali regresní model pro predikci cukrovky u pacientů, protokolovaný soubor MLmodel může vypadat takto:

artifact_path: model
flavors:
  python_function:
    env:
      conda: conda.yaml
      virtualenv: python_env.yaml
    loader_module: mlflow.sklearn
    model_path: model.pkl
    predict_fn: predict
    python_version: 3.10.10
  sklearn:
    code: null
    pickled_model: model.pkl
    serialization_format: cloudpickle
    sklearn_version: 1.2.0
mlflow_version: 2.1.1
model_uuid: 8370150f4e07495794c3b80bcaf07e52
run_id: 14cdf02f-119b-4b8d-90f3-044987c29bce
signature:
  inputs: '[{"type": "tensor", "tensor-spec": {"dtype": "float64", "shape": [-1, 10]}}]'
  outputs: '[{"type": "tensor", "tensor-spec": {"dtype": "float64", "shape": [-1]}}]'

Když se rozhodnete použít funkci automatickéhologování MLflow v Microsoft Fabric, soubor MLmodel se automaticky vytvoří za vás. Pokud chcete změnit soubor a změnit chování modelu během bodování, můžete změnit způsob protokolování souboru MLmodel.

Tip

Přečtěte si další informace o souborech modelů MLflow a o tom, jak přizpůsobit pole.

Správa modelů v Microsoft Fabric

Když během trénování v Microsoft Fabric sledujete model s MLflow, všechny artefakty modelu se uloží do model složky. Složku můžete najít model ve spuštění experimentu:

Screenshot of the model folder overview in an experiment run.

Složka modelu obsahuje:

MLmodel: Obsahuje metadata modelu.
conda.yaml: Obsahuje prostředí Anaconda potřebné ke spuštění modelu.
model.pkl: Obsahuje natrénovaný model.
python_env.yaml: Popisuje prostředí Pythonu potřebné ke spuštění modelu. Odkazuje na requirements.txt soubor.
requirements.txt: Vypíše balíčky Pythonu potřebné ke spuštění modelu.

Všechny tyto artefakty modelu jsou nezbytné, když chcete použít model k vygenerování předpovědí na nových datech.

Uložení modelu do pracovního prostoru

Když zvolíte model, který chcete použít, můžete ho uložit do pracovního prostoru ze spuštění experimentu. Uložením modelu vytvoříte v pracovním prostoru nový model s verzí, který obsahuje všechny artefakty a metadata modelu.

Vyberte spuštění experimentu, které představuje model, který jste natrénovali, a výběrem možnosti Uložit uložte spuštění jako model.

Screenshot of the save as model pop-up in Microsoft Fabric.

Výběrem existujícího modelu vytvoříte novou verzi modelu pod stejným názvem. Správa verzí modelu umožňuje porovnávat modely, které slouží k podobnému účelu, a potom si můžete vybrat model s nejlepším výkonem pro generování předpovědí.

Screenshot of the model overview in Microsoft Fabric.

Správa modelů v Microsoft Fabric

Sledování artefaktů modelu pomocí MLflow

Vysvětlení souboru MLmodel

Správa modelů v Microsoft Fabric

Uložení modelu do pracovního prostoru

Váš názor