Del via


Automatisk logning i Microsoft Fabric

Synapse Data Science i Microsoft Fabric omfatter automatisk logføring, hvilket reducerer mængden af kode, der kræves for automatisk at logføre parametre, målepunkter og elementer i en model til maskinel indlæring under oplæringen. I denne artikel beskrives autologging for Synapse Data Science i Microsoft Fabric.

Autologging udvider MLflow Tracking-funktioner og er dybt integreret i Synapse Data Science i Microsoft Fabric-oplevelsen. Automatisk logning kan registrere forskellige målepunkter, herunder nøjagtighed, tab, F1-score og brugerdefinerede målepunkter, som du definerer. Ved hjælp af autologging kan udviklere og datateknikere nemt spore og sammenligne ydeevnen af forskellige modeller og eksperimenter uden manuel sporing.

Understøttede strukturer

Autologging understøtter en lang række strukturer til maskinel indlæring, herunder TensorFlow, PyTorch, Scikit-learn og XGBoost. Du kan få mere at vide om de strukturspecifikke egenskaber, der registreres automatisk, i dokumentationen til MLflow.

Konfiguration

Automatisk logning fungerer ved automatisk at registrere værdier for inputparametre, outputmetrik og outputelementer i en model til maskinel indlæring, efterhånden som den oplæres. Disse oplysninger logføres i dit Microsoft Fabric-arbejdsområde, hvor du kan få adgang til og visualisere dem ved hjælp af MLflow-API'erne eller de tilsvarende eksperiment- og modelelementer i dit Microsoft Fabric-arbejdsområde.

Når du starter en Synapse Data Science-notesbog, kalder Microsoft Fabric mlflow.autolog() for straks at aktivere sporing og indlæse de tilsvarende afhængigheder. Når du oplærer modeller i din notesbog, sporer MLflow automatisk disse modeloplysninger.

Konfigurationen sker automatisk i baggrunden, når du kører import mlflow. Standardkonfigurationen for krogen mlflow.autolog() for notesbogen er:


mlflow.autolog(
    log_input_examples=False,
    log_model_signatures=True,
    log_models=True,
    disable=False,
    exclusive=True,
    disable_for_unsupported_versions=True,
    silent=True
)

Tilpasning

Hvis du vil tilpasse logføringsfunktionsmåden, kan du bruge konfigurationen mlflow.autolog(). Denne konfiguration indeholder parametre, der aktiverer modellogføring, indsamler inputeksempler, konfigurerer advarsler eller aktiverer logføring for tilføjet indhold, som du angiver.

Spor flere målepunkter, parametre og egenskaber

For kørsler, der er oprettet med MLflow, skal du opdatere konfigurationen af automatisk logføring af MLflow for at spore yderligere målepunkter, parametre, filer og metadata på følgende måde:

  1. Opdater mlflow.autolog()-kaldet for at angive exclusive=False.

        mlflow.autolog(
        log_input_examples=False,
        log_model_signatures=True,
        log_models=True,
        disable=False,
        exclusive=False, # Update this property to enable custom logging
        disable_for_unsupported_versions=True,
        silent=True
    )
    
  2. Brug MLflow-sporings-API'er til at logføre yderligere parametre og målepunkter. Følgende eksempelkode giver dig mulighed for at logge dine brugerdefinerede målepunkter og parametre sammen med yderligere egenskaber.

    import mlflow
    mlflow.autolog(exclusive=False)
    
    with mlflow.start_run():
      mlflow.log_param("parameter name", "example value")
      # <add model training code here>
      mlflow.log_metric("metric name", 20)
    

Deaktiver automatisk microsoft Fabric-logging

Du kan deaktivere automatisk microsoft Fabric-logning for en bestemt notesbogsession. Du kan også deaktivere automatisklogging på tværs af alle notesbøger ved hjælp af indstillingen for arbejdsområdet.

Bemærk

Hvis automatisklogging er deaktiveret, skal du manuelt logge dine parametre og målepunkter ved hjælp af MLflow-API'erne.

Deaktiver automatisk logning for en notesbogsession

Hvis du vil deaktivere automatisk microsoft Fabric-logging for en bestemt notesbogsession, skal du kalde mlflow.autolog() og angive disable=True.

import mlflow
mlflow.autolog(disable=True)

Deaktiver automatisk logning for alle notesbøger og sessioner

Administratorer af arbejdsområder kan aktivere eller deaktivere automatisk microsoft Fabric-logning for alle notesbøger og sessioner i deres arbejdsområde ved hjælp af indstillingerne for arbejdsområdet. Sådan aktiverer eller deaktiverer du automatisk logning af Synapse Data Science:

  1. I arbejdsområdet Synapse Data Science skal du vælge Indstillinger for arbejdsområde.

    Skærmbillede af siden Synapse Data Science med Indstillinger for arbejdsområde fremhævet.

  2. På skærmen Indstillinger for arbejdsområde skal du udvide Dataudvikler ing/Videnskab på navigationslinjen til venstre og vælge Spark-indstillinger.

  3. På skærmen Spark-indstillinger skal du vælge fanen Automatisk log.

  4. Angiv Automatisk sporing af eksperimenter og modeller for maskinel indlæring til Til eller Fra.

  5. Vælg Gem.

    Skærmbillede af indstillingen for arbejdsområdet Datavidenskab til automatisk logning.