Automatisch aanmelden in Microsoft Fabric
Synapse Data Science in Microsoft Fabric bevat automatische logboekregistratie, waardoor de hoeveelheid code die nodig is om tijdens de training automatisch de parameters, metrische gegevens en items van een machine learning-model te registreren, aanzienlijk wordt verminderd. In dit artikel wordt het automatisch aanmelden voor Synapse Data Science in Microsoft Fabric beschreven.
Autologging breidt de mogelijkheden van MLflow Tracking uit en is diep geïntegreerd in de Data Science-ervaring in Microsoft Fabric van Synapse. Automatisch vastleggen kan verschillende metrische gegevens vastleggen, waaronder nauwkeurigheid, verlies, F1-score en aangepaste metrische gegevens die u definieert. Door autologging te gebruiken, kunnen ontwikkelaars en gegevenswetenschappers eenvoudig de prestaties van verschillende modellen en experimenten bijhouden en vergelijken zonder handmatig bij te houden.
Ondersteunde frameworks
Autologging ondersteunt een breed scala aan machine learning-frameworks, waaronder TensorFlow, PyTorch, Scikit-learn en XGBoost. Voor meer informatie over de frameworkspecifieke eigenschappen die automatisch worden vastgelegd, raadpleeg de MLflow-documentatie.
Configuratie
Autologging werkt door automatisch waarden van invoerparameters, metrische uitvoergegevens en uitvoeritems van een machine learning-model vast te leggen terwijl deze wordt getraind. Deze informatie wordt vastgelegd in uw Microsoft Fabric-werkruimte, waar u deze kunt openen en visualiseren met behulp van de MLflow-API's of het bijbehorende experiment en modelitems in uw Microsoft Fabric-werkruimte.
Wanneer u een Synapse Data Science-notebook start, roept Microsoft Fabric mlflow.autolog() aan om het bijhouden en laden van de bijbehorende afhankelijkheden direct in te schakelen. Terwijl u modellen traint in uw notebook, houdt MLflow deze modelgegevens automatisch bij.
De configuratie gebeurt automatisch achter de schermen wanneer u import mlflow
uitvoert. De standaardconfiguratie voor de notebook mlflow.autolog() hook is:
mlflow.autolog(
log_input_examples=False,
log_model_signatures=True,
log_models=True,
disable=False,
exclusive=True,
disable_for_unsupported_versions=True,
silent=True
)
Aanpassing
Als u het gedrag van logboekregistratie wilt aanpassen, kunt u de mlflow.autolog() configuratie gebruiken. Deze configuratie biedt parameters voor het inschakelen van modelregistratie, het verzamelen van invoervoorbeelden, het configureren van waarschuwingen of het inschakelen van logboekregistratie voor toegevoegde inhoud die u opgeeft.
Meer metrische gegevens, parameters en eigenschappen bijhouden
Werk voor uitvoeringen die zijn gemaakt met MLflow de configuratie voor automatische aanmelding van MLflow bij om aanvullende meetwaarden, parameters, bestanden en metagegevens als volgt bij te houden:
Werk de aanroep mlflow.autolog() bij om
exclusive=False
in te stellen.mlflow.autolog( log_input_examples=False, log_model_signatures=True, log_models=True, disable=False, exclusive=False, # Update this property to enable custom logging disable_for_unsupported_versions=True, silent=True )
Gebruik de MLflow-tracerings-API's om extra parameters en metrische gegevenste registreren. Met de volgende voorbeeldcode kunt u uw aangepaste metrische gegevens en parameters registreren naast aanvullende eigenschappen.
import mlflow mlflow.autolog(exclusive=False) with mlflow.start_run(): mlflow.log_param("parameter name", "example value") # <add model training code here> mlflow.log_metric("metric name", 20)
Automatische aanmelding van Microsoft Fabric uitschakelen
U kunt automatische aanmelding van Microsoft Fabric uitschakelen voor een specifieke notebooksessie. U kunt automatische logboeken ook uitschakelen voor alle notitieblokken met behulp van de werkruimte-instelling.
Notitie
Als automatisch registreren is uitgeschakeld, moet u uw parameters en metrische gegevens handmatig registreren met behulp van de MLflow-API's.
Automatisch afmelden uitschakelen voor een notebooksessie
Als u automatische aanmelding van Microsoft Fabric voor een specifieke notebooksessie wilt uitschakelen, roept u mlflow.autolog() aan en stelt u disable=True
in.
import mlflow
mlflow.autolog(disable=True)
Autologging uitschakelen voor alle notitieblokken en sessies
Werkruimtebeheerders kunnen automatische aanmelding van Microsoft Fabric in- of uitschakelen voor alle notitieblokken en sessies in hun werkruimte met behulp van de werkruimte-instellingen. In- of uitschakelen van automatisch loggen voor Synapse Data Science:
In uw werkruimte selecteert u Werkruimte-instellingen.
Vouw in werkruimte-instellingenData Engineering/Science in de linkernavigatiebalk uit en selecteer Spark-instellingen.
Selecteer in Spark-instellingenhet tabblad Automatisch logboek.
Stel in
Machine Learning-experimenten en -modellen automatisch bijhouden op ofUit te. Selecteer opslaan.