automl Pakket
Bevat geautomatiseerde machine learning-klassen voor Azure Machine Learning SDKv2.
De belangrijkste gebieden zijn het beheren van AutoML-taken.
Klassen
ClassificationJob |
Configuratie voor AutoML-classificatietaak. Initialiseer een nieuwe AutoML-classificatietaak. |
ColumnTransformer |
Instellingen voor kolomtransformator. |
ForecastingJob |
Configuratie voor AutoML-prognosetaak. Initialiseer een nieuwe AutoML-prognosetaak. |
ForecastingSettings |
Instellingen voor prognoses voor een AutoML-taak. |
ImageClassificationJob |
Configuratie voor autoML-taak voor afbeeldingsclassificatie met meerdere klassen. Initialiseer een nieuwe AutoML-taak voor afbeeldingsclassificatie met meerdere klassen. |
ImageClassificationMultilabelJob |
Configuratie voor autoML-taak voor afbeeldingsclassificatie met meerdere labels. Initialiseer een nieuwe AutoML-taak voor afbeeldingsclassificatie met meerdere labels. |
ImageClassificationSearchSpace |
Zoekruimte voor autoML-afbeeldingsclassificatie en afbeeldingsclassificatie met meerdere labels. |
ImageInstanceSegmentationJob |
Configuratie voor de taak Segmentatie van autoML-installatiekopieën. Initialiseer een nieuwe taak voor het segmenteren van een exemplaar van een AutoML-installatiekopieën. |
ImageLimitSettings |
Instellingen voor AutoML-afbeeldingsverticalen beperken. ImageLimitSettings is een klasse die de volgende parameters bevat: max_concurrent_trials, max_trials en timeout_minutes. Dit is een optionele configuratiemethode voor het configureren van limietparameters, zoals time-outs, enzovoort. Notitie Het aantal gelijktijdige uitvoeringen is afhankelijk van de resources die beschikbaar zijn in het opgegeven rekendoel. Zorg ervoor dat het rekendoel de beschikbare resources heeft voor de gewenste gelijktijdigheid. Tip Het is een goede gewoonte om max_concurrent_trials aantal te vergelijken met het aantal knooppunten in het cluster. Als u bijvoorbeeld een cluster met vier knooppunten hebt, stelt u max_concurrent_trials in op 4. Voorbeeld van gebruik Configuratie van ImageLimitSettings
Initialiseer een ImageLimitSettings-object. Constructor voor ImageLimitSettings voor AutoML Image Verticals. |
ImageModelSettingsClassification |
Modelinstellingen voor autoML-afbeeldingsclassificatietaken. |
ImageModelSettingsObjectDetection |
Modelinstellingen voor AutoML Image Object Detection Task. |
ImageObjectDetectionJob |
Configuratie voor autoML Image Object Detection-taak. Initialiseer een nieuwe AutoML Image Object Detection-taak. |
ImageObjectDetectionSearchSpace |
Zoekruimte naar autoML-afbeeldingsobjectdetectie en segmentatietaken van afbeeldingsexemplaar. |
ImageSweepSettings |
Veeginstellingen voor alle AutoML-afbeeldingsverticalen. |
NlpFeaturizationSettings |
Featurization-instellingen voor alle AutoML NLP Verticals. |
NlpFixedParameters |
Object om vaste parameters voor NLP-taken op te geven. |
NlpLimitSettings |
Beperk instellingen voor alle AutoML NLP-verticalen. |
NlpSearchSpace |
Zoekruimte voor AutoML NLP-taken. |
NlpSweepSettings |
Sweep-instellingen voor alle AutoML NLP-taken. |
RegressionJob |
Configuratie voor AutoML-regressietaak. Initialiseer een nieuwe AutoML-regressietaak. |
SearchSpace |
SearchSpace-klasse voor AutoML-verticalen. |
StackEnsembleSettings |
Geavanceerde instelling om stackEnsemble-uitvoering aan te passen. |
TabularFeaturizationSettings |
Featurization-instellingen voor een AutoML-taak. |
TabularLimitSettings |
Instellingen beperken voor autoML-tabelverticalen. |
TextClassificationJob |
Configuratie voor autoML-tekstclassificatietaak. Initialiseert een nieuwe AutoML-tekstclassificatietaak. |
TextClassificationMultilabelJob |
Configuratie voor autoML-tekstclassificatie multilabeltaak. Initialiseert een nieuwe AutoML-taak voor tekstclassificatie met meerdere labels. |
TextNerJob |
Configuratie voor AutoML-tekst-NER-taak. Initialiseert een nieuwe AutoML-tekst-NER-taak. |
TrainingSettings |
TrainingSettings-klasse voor Azure Machine Learning. TrainingSettings-klasse voor Azure Machine Learning. |
Enums
BlockedTransformers |
Opsomming voor alle classificatiemodellen die door AutoML worden ondersteund. |
ClassificationModels |
Opsomming voor alle classificatiemodellen die door AutoML worden ondersteund. |
ClassificationMultilabelPrimaryMetrics |
Primaire metrische gegevens voor classificatietaken met meerdere labels. |
ClassificationPrimaryMetrics |
Primaire metrische gegevens voor classificatietaken. |
FeaturizationMode |
Featurization-modus: bepaalt de gegevens featurization-modus. |
ForecastHorizonMode |
Enum om de selectiemodus voor de voorspellingshorizon te bepalen. |
ForecastingModels |
Opsomming voor alle prognosemodellen die door AutoML worden ondersteund. |
ForecastingPrimaryMetrics |
Primaire metrische gegevens voor prognosetaak. |
InstanceSegmentationPrimaryMetrics |
Primaire metrische gegevens voor InstanceSegmentation-taken. |
LearningRateScheduler |
Enum learning rate scheduler. |
LogTrainingMetrics |
Bevat geautomatiseerde machine learning-klassen voor Azure Machine Learning SDKv2. De belangrijkste gebieden zijn het beheren van AutoML-taken. |
LogValidationLoss |
Bevat geautomatiseerde machine learning-klassen voor Azure Machine Learning SDKv2. De belangrijkste gebieden zijn het beheren van AutoML-taken. |
NCrossValidationsMode |
Bepaalt hoe de waarde van N-Cross-validaties wordt bepaald. |
ObjectDetectionPrimaryMetrics |
Primaire metrische gegevens voor de taak Image ObjectDetection. |
RegressionModels |
Opsomming voor alle regressiemodellen die worden ondersteund door AutoML. |
RegressionPrimaryMetrics |
Primaire metrische gegevens voor regressietaak. |
SamplingAlgorithmType |
Bevat geautomatiseerde machine learning-klassen voor Azure Machine Learning SDKv2. De belangrijkste gebieden zijn het beheren van AutoML-taken. |
ShortSeriesHandlingConfiguration |
De parameter die definieert hoe autoML korte tijdreeksen moet verwerken. |
StochasticOptimizer |
Stochastic optimizer voor afbeeldingsmodellen. |
TargetAggregationFunction |
Statistische doelfunctie. |
TargetLagsMode |
Doel zorgt voor vertraging bij selectiemodi. |
TargetRollingWindowSizeMode |
Doelmodus voor de grootte van rollende vensters. |
UseStl |
Configureer STL-ontleding van de doelkolom van de tijdreeks. |
ValidationMetricType |
Metrische berekeningsmethode voor validatie van metrische gegevens in afbeeldingstaken. |
Functies
classification
Functie voor het maken van een classificatietaak.
Een classificatietaak wordt gebruikt om een model te trainen dat de klasse van een gegevensvoorbeeld het beste voorspelt. Verschillende modellen worden getraind met behulp van de trainingsgegevens. Het model met de beste prestaties voor de validatiegegevens op basis van de primaire metrische gegevens wordt geselecteerd als het uiteindelijke model.
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
Parameters
- training_data
- Input
De trainingsgegevens die in het experiment moeten worden gebruikt. Deze moet zowel trainingsfuncties als een labelkolom bevatten (optioneel een voorbeeldkolom met gewichten).
- target_column_name
- str
De naam van de labelkolom.
Deze parameter is van toepassing op training_data
de parameters , validation_data
en test_data
- primary_metric
De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Acceptabele waarden: nauwkeurigheid, AUC_weighted, norm_macro_recall, average_precision_score_weighted en precision_score_weighted Standaardwaarden voor nauwkeurigheid
- enable_model_explainability
- bool
Of u uitleg van het beste AutoML-model aan het einde van alle AutoML-trainingsiteraties wilt inschakelen. De standaardwaarde is None. Zie Interpretability: model explanations in automated machine learning (Interpretability: model explanations in automated machine learning) voor meer informatie.
- weight_column_name
- str
De naam van de kolom met het gewicht van het voorbeeld. Geautomatiseerde ML ondersteunt een gewogen kolom als invoer, waardoor rijen in de gegevens omhoog of omlaag worden gewogen. Als de invoergegevens afkomstig zijn van een pandas. DataFrame dat geen kolomnamen heeft, kunnen in plaats daarvan kolomindexen worden gebruikt, uitgedrukt als gehele getallen.
Deze parameter is van toepassing op training_data
parameters en validation_data
- validation_data
- Input
De validatiegegevens die in het experiment moeten worden gebruikt. Deze moet zowel trainingsfuncties als labelkolom bevatten (optioneel een kolom met voorbeeldgewichten).
Standaard ingesteld op Geen
- validation_data_size
- float
Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.
Geef op validation_data
om validatiegegevens op te geven, anders in te stellen n_cross_validations
of validation_data_size
om validatiegegevens uit de opgegeven trainingsgegevens te extraheren.
Gebruik cv_split_column_names
voor aangepaste kruisvalidatievouw.
Zie Gegevenssplitsingen en kruisvalidatie configureren in geautomatiseerde machine learning voor meer informatie.
Standaard ingesteld op Geen
Hoeveel kruisvalidaties moeten worden uitgevoerd wanneer er geen gebruikersvalidatiegegevens zijn opgegeven.
Geef op validation_data
om validatiegegevens op te geven, anders in te stellen n_cross_validations
of validation_data_size
om validatiegegevens uit de opgegeven trainingsgegevens te extraheren.
Gebruik cv_split_column_names
voor aangepaste kruisvalidatievouw.
Zie Gegevenssplitsingen en kruisvalidatie configureren in geautomatiseerde machine learning voor meer informatie.
Standaard ingesteld op Geen
Lijst met namen van de kolommen die een aangepaste kruisvalidatiesplitsing bevatten. Elk van de kolommen voor het splitsen van cv's vertegenwoordigt één CV-splitsing waarbij elke rij is gemarkeerd als 1 voor training of 0 voor validatie.
Standaard ingesteld op Geen
- test_data
- Input
De functie Modeltest met behulp van testgegevenssets of splitsingen van testgegevens is een functie met de preview-status en kan op elk gewenst moment worden gewijzigd. De testgegevens die moeten worden gebruikt voor een testuitvoering die automatisch wordt gestart nadat de modeltraining is voltooid. De testuitvoering krijgt voorspellingen met behulp van het beste model en berekent metrische gegevens op basis van deze voorspellingen.
Als deze parameter of de test_data_size
parameter niet zijn opgegeven, wordt er geen testuitvoering automatisch uitgevoerd nadat de modeltraining is voltooid.
Testgegevens moeten zowel functies als labelkolom bevatten.
Als test_data
is opgegeven, moet de target_column_name
parameter worden opgegeven.
Standaard ingesteld op Geen
- test_data_size
- float
De functie Modeltest met behulp van testgegevenssets of splitsingen van testgegevens is een functie met de preview-status en kan op elk gewenst moment worden gewijzigd. Welk deel van de trainingsgegevens moet worden gebruikt voor testgegevens voor een testuitvoering die automatisch wordt gestart nadat de modeltraining is voltooid. De testuitvoering krijgt voorspellingen met behulp van het beste model en berekent metrische gegevens op basis van deze voorspellingen.
Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.
Als test_data_size
wordt opgegeven op hetzelfde moment als validation_data_size
, worden de testgegevens gesplitst training_data
voordat de validatiegegevens worden gesplitst.
Als validation_data_size=0.1
bijvoorbeeld en test_data_size=0.1
de oorspronkelijke trainingsgegevens 1000 rijen hebben, hebben de testgegevens 100 rijen, bevatten de validatiegegevens 90 rijen en de trainingsgegevens 810 rijen.
Voor taken op basis van regressie wordt willekeurige steekproeven gebruikt. Voor classificatietaken wordt gestratificeerde steekproeven gebruikt. Prognose biedt momenteel geen ondersteuning voor het opgeven van een testgegevensset met behulp van een train-/testsplitsing.
Als deze parameter of de test_data
parameter niet zijn opgegeven, wordt er geen testuitvoering automatisch uitgevoerd nadat de modeltraining is voltooid.
Standaard ingesteld op Geen
Retouren
Een taakobject dat kan worden verzonden naar een Azure ML-berekening voor uitvoering.
Retourtype
forecasting
Functie om een prognosetaak te maken.
Een prognosetaak wordt gebruikt om doelwaarden voor een toekomstige periode te voorspellen op basis van de historische gegevens. Verschillende modellen worden getraind met behulp van de trainingsgegevens. Het model met de beste prestaties voor de validatiegegevens op basis van de primaire metrische gegevens wordt geselecteerd als het uiteindelijke model.
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
Parameters
- training_data
- Input
De trainingsgegevens die in het experiment moeten worden gebruikt. Deze moet zowel trainingsfuncties als een labelkolom bevatten (optioneel een voorbeeldkolom met gewichten).
- target_column_name
- str
De naam van de labelkolom.
Deze parameter is van toepassing op training_data
de parameters , validation_data
en test_data
- primary_metric
De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Acceptabele waarden: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Standaardwaarden voor normalized_root_mean_squared_error
- enable_model_explainability
- bool
Of u uitleg van het beste AutoML-model aan het einde van alle AutoML-trainingsiteraties wilt inschakelen. De standaardwaarde is None. Zie Interpretability: model explanations in automated machine learning (Interpretability: model explanations in automated machine learning) voor meer informatie.
- weight_column_name
- str
De naam van de kolom met het gewicht van het voorbeeld. Geautomatiseerde ML ondersteunt een gewogen kolom als invoer, waardoor rijen in de gegevens omhoog of omlaag worden gewogen. Als de invoergegevens afkomstig zijn van een pandas. DataFrame dat geen kolomnamen heeft, kunnen in plaats daarvan kolomindexen worden gebruikt, uitgedrukt als gehele getallen.
Deze parameter is van toepassing op training_data
parameters en validation_data
- validation_data
- Input
De validatiegegevens die in het experiment moeten worden gebruikt. Deze moet zowel trainingsfuncties als labelkolom bevatten (optioneel een kolom met voorbeeldgewichten).
Standaard ingesteld op Geen
- validation_data_size
- float
Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.
Geef op validation_data
om validatiegegevens op te geven, anders in te stellen n_cross_validations
of validation_data_size
om validatiegegevens uit de opgegeven trainingsgegevens te extraheren.
Gebruik cv_split_column_names
voor aangepaste kruisvalidatievouw.
Zie Gegevenssplitsingen en kruisvalidatie configureren in geautomatiseerde machine learning voor meer informatie.
Standaard ingesteld op Geen
Hoeveel kruisvalidaties moeten worden uitgevoerd wanneer er geen gebruikersvalidatiegegevens zijn opgegeven.
Geef op validation_data
om validatiegegevens op te geven, anders in te stellen n_cross_validations
of validation_data_size
om validatiegegevens uit de opgegeven trainingsgegevens te extraheren.
Gebruik cv_split_column_names
voor aangepaste kruisvalidatievouw.
Zie Gegevenssplitsingen en kruisvalidatie configureren in geautomatiseerde machine learning voor meer informatie.
Standaard ingesteld op Geen
Lijst met namen van de kolommen die een aangepaste kruisvalidatiesplitsing bevatten. Elk van de kolommen voor het splitsen van cv's vertegenwoordigt één CV-splitsing waarbij elke rij is gemarkeerd als 1 voor training of 0 voor validatie.
Standaard ingesteld op Geen
- test_data
- Input
De functie Modeltest met behulp van testgegevenssets of splitsingen van testgegevens is een functie met de preview-status en kan op elk gewenst moment worden gewijzigd. De testgegevens die moeten worden gebruikt voor een testuitvoering die automatisch wordt gestart nadat de modeltraining is voltooid. De testuitvoering krijgt voorspellingen met behulp van het beste model en berekent metrische gegevens op basis van deze voorspellingen.
Als deze parameter of de test_data_size
parameter niet zijn opgegeven, wordt er geen testuitvoering automatisch uitgevoerd nadat de modeltraining is voltooid.
Testgegevens moeten zowel functies als labelkolom bevatten.
Als test_data
is opgegeven, moet de target_column_name
parameter worden opgegeven.
Standaard ingesteld op Geen
- test_data_size
- float
De functie Modeltest met behulp van testgegevenssets of splitsingen van testgegevens is een functie met de preview-status en kan op elk gewenst moment worden gewijzigd. Welk deel van de trainingsgegevens moet worden gebruikt voor testgegevens voor een testuitvoering die automatisch wordt gestart nadat de modeltraining is voltooid. De testuitvoering krijgt voorspellingen met behulp van het beste model en berekent metrische gegevens op basis van deze voorspellingen.
Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.
Als test_data_size
wordt opgegeven op hetzelfde moment als validation_data_size
, worden de testgegevens gesplitst training_data
voordat de validatiegegevens worden gesplitst.
Als validation_data_size=0.1
bijvoorbeeld en test_data_size=0.1
de oorspronkelijke trainingsgegevens 1000 rijen hebben, hebben de testgegevens 100 rijen, bevatten de validatiegegevens 90 rijen en de trainingsgegevens 810 rijen.
Voor taken op basis van regressie wordt willekeurige steekproeven gebruikt. Voor classificatietaken wordt gestratificeerde steekproeven gebruikt. Prognose biedt momenteel geen ondersteuning voor het opgeven van een testgegevensset met behulp van een train-/testsplitsing.
Als deze parameter of de test_data
parameter niet zijn opgegeven, wordt er geen testuitvoering automatisch uitgevoerd nadat de modeltraining is voltooid.
Standaard ingesteld op Geen
- forecasting_settings
- ForecastingSettings
De instellingen voor de prognosetaak
Retouren
Een taakobject dat kan worden verzonden naar een Azure ML-berekening voor uitvoering.
Retourtype
image_classification
Hiermee maakt u een object voor de classificatietaak autoML-installatiekopieën met meerdere klassen.
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
Parameters
- training_data
- Input
De trainingsgegevens die in het experiment moeten worden gebruikt.
- target_column_name
- str
De naam van de labelkolom.
Deze parameter is van toepassing op training_data
de parameters en validation_data
.
- primary_metric
De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Acceptabele waarden: nauwkeurigheid, AUC_weighted, norm_macro_recall, average_precision_score_weighted en precision_score_weighted Standaardwaarden voor nauwkeurigheid.
- validation_data
- Input
De validatiegegevens die in het experiment moeten worden gebruikt.
- validation_data_size
- float
Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.
Geef validation_data
op om validatiegegevens op te geven. Stel anders in validation_data_size
dat validatiegegevens uit de opgegeven trainingsgegevens worden geëxtraheerd.
Standaard ingesteld op .2
- kwargs
- dict
Een woordenlijst met aanvullende configuratieparameters.
Retouren
Taakobject voor afbeeldingsclassificatie dat kan worden verzonden naar een Azure ML-berekening voor uitvoering.
Retourtype
image_classification_multilabel
Hiermee maakt u een object voor de taak Classificatie van AutoML-installatiekopieën met meerdere labels.
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
Parameters
- training_data
- Input
De trainingsgegevens die in het experiment moeten worden gebruikt.
- target_column_name
- str
De naam van de labelkolom.
Deze parameter is van toepassing op training_data
de parameters en validation_data
.
- primary_metric
De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Acceptabele waarden: nauwkeurigheid, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted en standaardinstellingen voor Iou.
- validation_data
- Input
De validatiegegevens die in het experiment moeten worden gebruikt.
- validation_data_size
- float
Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.
Geef validation_data
op om validatiegegevens op te geven. Stel anders in validation_data_size
dat validatiegegevens uit de opgegeven trainingsgegevens worden geëxtraheerd.
Standaard ingesteld op .2
- kwargs
- dict
Een woordenlijst met aanvullende configuratieparameters.
Retouren
Afbeelding van een classificatietaakobject met meerdere labels dat kan worden verzonden naar een Azure ML-berekening voor uitvoering.
Retourtype
image_instance_segmentation
Hiermee maakt u een object voor de taak Segmentatie van autoML-installatiekopieënexemplaar.
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
Parameters
- training_data
- Input
De trainingsgegevens die in het experiment moeten worden gebruikt.
- target_column_name
- str
De naam van de labelkolom.
Deze parameter is van toepassing op training_data
de parameters en validation_data
.
- primary_metric
De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Acceptabele waarden: MeanAveragePrecision is standaard ingesteld op MeanAveragePrecision.
- validation_data
- Input
De validatiegegevens die in het experiment moeten worden gebruikt.
- validation_data_size
- float
Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.
Geef validation_data
op om validatiegegevens op te geven. Stel anders in validation_data_size
dat validatiegegevens uit de opgegeven trainingsgegevens worden geëxtraheerd.
Standaard ingesteld op .2
- kwargs
- dict
Een woordenlijst met aanvullende configuratieparameters.
Retouren
Segmentatietaak voor afbeeldingsexemplaar
Retourtype
image_object_detection
Hiermee maakt u een object voor de taak AutoML Image Object Detection.
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
Parameters
- training_data
- Input
De trainingsgegevens die in het experiment moeten worden gebruikt.
- target_column_name
- str
De naam van de labelkolom.
Deze parameter is van toepassing op training_data
de parameters en validation_data
.
- primary_metric
De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Acceptabele waarden: MeanAveragePrecision is standaard ingesteld op MeanAveragePrecision.
- validation_data
- Input
De validatiegegevens die in het experiment moeten worden gebruikt.
- validation_data_size
- float
Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.
Geef validation_data
op om validatiegegevens op te geven. Stel anders in validation_data_size
dat validatiegegevens uit de opgegeven trainingsgegevens worden geëxtraheerd.
Standaard ingesteld op .2
- kwargs
- dict
Een woordenlijst met aanvullende configuratieparameters.
Retouren
Taakobject voor afbeeldingsobjectdetectie dat kan worden verzonden naar een Azure ML-berekening voor uitvoering.
Retourtype
regression
Functie voor het maken van een regressietaak.
Een regressietaak wordt gebruikt om een model te trainen om continue waarden van een doelvariabele te voorspellen vanuit een gegevensset. Verschillende modellen worden getraind met behulp van de trainingsgegevens. Het model met de beste prestaties voor de validatiegegevens op basis van de primaire metrische gegevens wordt geselecteerd als het uiteindelijke model.
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
Parameters
- training_data
- Input
De trainingsgegevens die in het experiment moeten worden gebruikt. Deze moet zowel trainingsfuncties als een labelkolom bevatten (optioneel een voorbeeldkolom met gewichten).
- target_column_name
- str
De naam van de labelkolom.
Deze parameter is van toepassing op training_data
de parameters , validation_data
en test_data
- primary_metric
De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Acceptabele waarden: spearman_correlation, r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error. Standaard ingesteld op normalized_root_mean_squared_error
- enable_model_explainability
- bool
Of u uitleg van het beste AutoML-model aan het einde van alle AutoML-trainingsiteraties wilt inschakelen. De standaardwaarde is None. Zie Interpretability: model explanations in automated machine learning (Interpretability: model explanations in automated machine learning) voor meer informatie.
- weight_column_name
- str
De naam van de kolom met het gewicht van het voorbeeld. Geautomatiseerde ML ondersteunt een gewogen kolom als invoer, waardoor rijen in de gegevens omhoog of omlaag worden gewogen. Als de invoergegevens afkomstig zijn van een pandas. DataFrame dat geen kolomnamen heeft, kunnen in plaats daarvan kolomindexen worden gebruikt, uitgedrukt als gehele getallen.
Deze parameter is van toepassing op training_data
parameters en validation_data
- validation_data
- Input
De validatiegegevens die in het experiment moeten worden gebruikt. Deze moet zowel trainingsfuncties als labelkolom bevatten (optioneel een kolom met voorbeeldgewichten).
Standaard ingesteld op Geen
- validation_data_size
- float
Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.
Geef op validation_data
om validatiegegevens op te geven, anders in te stellen n_cross_validations
of validation_data_size
om validatiegegevens uit de opgegeven trainingsgegevens te extraheren.
Gebruik cv_split_column_names
voor aangepaste kruisvalidatievouw.
Zie Gegevenssplitsingen en kruisvalidatie configureren in geautomatiseerde machine learning voor meer informatie.
Standaard ingesteld op Geen
Hoeveel kruisvalidaties moeten worden uitgevoerd wanneer er geen gebruikersvalidatiegegevens zijn opgegeven.
Geef op validation_data
om validatiegegevens op te geven, anders in te stellen n_cross_validations
of validation_data_size
om validatiegegevens uit de opgegeven trainingsgegevens te extraheren.
Gebruik cv_split_column_names
voor aangepaste kruisvalidatievouw.
Zie Gegevenssplitsingen en kruisvalidatie configureren in geautomatiseerde machine learning voor meer informatie.
Standaard ingesteld op Geen
Lijst met namen van de kolommen die een aangepaste kruisvalidatiesplitsing bevatten. Elk van de kolommen voor het splitsen van cv's vertegenwoordigt één CV-splitsing waarbij elke rij is gemarkeerd als 1 voor training of 0 voor validatie.
Standaard ingesteld op Geen
- test_data
- Input
De functie Modeltest met behulp van testgegevenssets of splitsingen van testgegevens is een functie met de preview-status en kan op elk gewenst moment worden gewijzigd. De testgegevens die moeten worden gebruikt voor een testuitvoering die automatisch wordt gestart nadat de modeltraining is voltooid. De testuitvoering krijgt voorspellingen met behulp van het beste model en berekent metrische gegevens op basis van deze voorspellingen.
Als deze parameter of de test_data_size
parameter niet zijn opgegeven, wordt er geen testuitvoering automatisch uitgevoerd nadat de modeltraining is voltooid.
Testgegevens moeten zowel functies als labelkolom bevatten.
Als test_data
is opgegeven, moet de target_column_name
parameter worden opgegeven.
Standaard ingesteld op Geen
- test_data_size
- float
De functie Modeltest met behulp van testgegevenssets of splitsingen van testgegevens is een functie met de preview-status en kan op elk gewenst moment worden gewijzigd. Welk deel van de trainingsgegevens moet worden gebruikt voor testgegevens voor een testuitvoering die automatisch wordt gestart nadat de modeltraining is voltooid. De testuitvoering krijgt voorspellingen met behulp van het beste model en berekent metrische gegevens op basis van deze voorspellingen.
Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.
Als test_data_size
wordt opgegeven op hetzelfde moment als validation_data_size
, worden de testgegevens gesplitst training_data
voordat de validatiegegevens worden gesplitst.
Als validation_data_size=0.1
bijvoorbeeld en test_data_size=0.1
de oorspronkelijke trainingsgegevens 1000 rijen hebben, hebben de testgegevens 100 rijen, bevatten de validatiegegevens 90 rijen en de trainingsgegevens 810 rijen.
Voor taken op basis van regressie wordt willekeurige steekproeven gebruikt. Voor classificatietaken wordt gestratificeerde steekproeven gebruikt. Prognose biedt momenteel geen ondersteuning voor het opgeven van een testgegevensset met behulp van een train-/testsplitsing.
Als deze parameter of de test_data
parameter niet zijn opgegeven, wordt er geen testuitvoering automatisch uitgevoerd nadat de modeltraining is voltooid.
Standaard ingesteld op Geen
Retouren
Een taakobject dat kan worden verzonden naar een Azure ML-berekening voor uitvoering.
Retourtype
text_classification
Functie voor het maken van een TextClassificationJob.
Een tekstclassificatietaak wordt gebruikt om een model te trainen waarmee de klasse/categorie van een tekstgegevens kan worden voorspeld. Invoertrainingsgegevens moeten een doelkolom bevatten die de tekst in precies één klasse classificeert.
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
Parameters
- training_data
- Input
De trainingsgegevens die in het experiment moeten worden gebruikt. Het moet zowel trainingsfuncties als een doelkolom bevatten.
- target_column_name
- str
Naam van de doelkolom.
- validation_data
- Input
De validatiegegevens die in het experiment moeten worden gebruikt. Het moet zowel trainingsfuncties als een doelkolom bevatten.
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
Primaire metrische gegevens voor de taak. Acceptabele waarden: nauwkeurigheid, AUC_weighted, precision_score_weighted
- log_verbosity
- str
Uitgebreidheidsniveau logboek.
- kwargs
- dict
Een woordenlijst met aanvullende configuratieparameters.
Retouren
Het object TextClassificationJob.
Retourtype
text_classification_multilabel
Functie voor het maken van een TextClassificationMultilabelJob.
Een taak met meerdere labels voor tekstclassificatie wordt gebruikt om een model te trainen waarmee de klassen/categorieën van een tekstgegevens kunnen worden voorspeld. Invoertrainingsgegevens moeten een doelkolom bevatten die de tekst in klasse(sen) classificeert. Raadpleeg voor meer informatie over de indeling van gegevens met meerdere labels: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
Parameters
- training_data
- Input
De trainingsgegevens die in het experiment moeten worden gebruikt. Het moet zowel trainingsfuncties als een doelkolom bevatten.
- target_column_name
- str
Naam van de doelkolom.
- validation_data
- Input
De validatiegegevens die in het experiment moeten worden gebruikt. Het moet zowel trainingsfuncties als een doelkolom bevatten.
- primary_metric
- str
Primaire metrische gegevens voor de taak. Acceptabele waarden: nauwkeurigheid
- log_verbosity
- str
Uitgebreidheidsniveau logboek.
- kwargs
- dict
Een woordenlijst met aanvullende configuratieparameters.
Retouren
Het object TextClassificationMultilabelJob.
Retourtype
text_ner
Functie voor het maken van een TextNerJob.
Een taak voor entiteitsherkenning met een tekstnaam wordt gebruikt om een model te trainen waarmee de benoemde entiteiten in de tekst kunnen worden voorspeld. Invoertrainingsgegevens moeten een tekstbestand in CoNLL-indeling zijn. Raadpleeg voor meer informatie over de indeling van tekst-NER-gegevens: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
Parameters
- training_data
- Input
De trainingsgegevens die in het experiment moeten worden gebruikt. Het moet zowel trainingsfuncties als een doelkolom bevatten.
- validation_data
- Input
De validatiegegevens die in het experiment moeten worden gebruikt. Het moet zowel trainingsfuncties als een doelkolom bevatten.
- primary_metric
- str
Primaire metrische gegevens voor de taak. Acceptabele waarden: nauwkeurigheid
- log_verbosity
- str
Uitgebreidheidsniveau logboek.
- kwargs
- dict
Een woordenlijst met aanvullende configuratieparameters.
Retouren
Het object TextNerJob.
Retourtype
Azure SDK for Python