Compartilhar via


automl Pacote

Contém classes de machine learning automatizadas para o SDKv2 do Azure Machine Learning.

As principais áreas incluem o gerenciamento de tarefas de AutoML.

Classes

ClassificationJob

Configuração do Trabalho de Classificação de AutoML.

Inicialize uma nova tarefa de Classificação de AutoML.

ColumnTransformer

Configurações do transformador de coluna.

ForecastingJob

Configuração da Tarefa de Previsão de AutoML.

Inicialize uma nova tarefa de Previsão de AutoML.

ForecastingSettings

Configurações de previsão para um trabalho AutoML.

ImageClassificationJob

Configuração do trabalho classificação de imagens de várias classes do AutoML.

Inicialize um novo trabalho de Classificação de Imagens de várias classes do AutoML.

ImageClassificationMultilabelJob

Configuração do trabalho classificação de imagens de vários rótulos do AutoML.

Inicialize um novo trabalho de Classificação de Imagens de vários rótulos do AutoML.

ImageClassificationSearchSpace

Espaço de pesquisa para tarefas de classificação de imagem automl e classificação de imagens multi-rótulo.

ImageInstanceSegmentationJob

Configuração para o trabalho de segmentação de instância de imagem do AutoML.

Inicialize um novo trabalho de Segmentação de Instância de Imagem AutoML.

ImageLimitSettings

Limitar as configurações para Verticais de Imagem AutoML.

ImageLimitSettings é uma classe que contém os seguintes parâmetros: max_concurrent_trials, max_trials e timeout_minutes.

Esse é um método de configuração opcional para configurar parâmetros de limites, como tempos limite etc.

Observação

O número de execuções simultâneas é ligado aos recursos disponíveis no destino de computação especificado.

Verifique se o destino de computação tem os recursos disponíveis para a simultaneidade desejada.

Dica

É uma boa prática corresponder max_concurrent_trials contagem com o número de nós no cluster.

Por exemplo, se você tiver um cluster com 4 nós, defina max_concurrent_trials como 4.

Exemplo de uso

Configuração de ImageLimitSettings


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

Inicialize um objeto ImageLimitSettings.

Construtor para ImageLimitSettings para Verticais de Imagem AutoML.

ImageModelSettingsClassification

Configurações de modelo para tarefas de Classificação de Imagem de AutoML.

ImageModelSettingsObjectDetection

Configurações de modelo para a Tarefa de Detecção de Objeto de Imagem AutoML.

ImageObjectDetectionJob

Configuração para o trabalho de Detecção de Objeto de Imagem AutoML.

Inicialize um novo trabalho de Detecção de Objeto de Imagem AutoML.

ImageObjectDetectionSearchSpace

Espaço de pesquisa para tarefas de detecção de objeto de imagem autoML e segmentação de instância de imagem.

ImageSweepSettings

Configurações de varredura para todas as Verticais de Imagem AutoML.

NlpFeaturizationSettings

Configurações de definição de recursos para todas as verticais de NLP do AutoML.

NlpFixedParameters

Objeto para abrigar parâmetros fixos para trabalhos NLP.

NlpLimitSettings

Limitar as configurações para todas as Verticais de NLP do AutoML.

NlpSearchSpace

Espaço de pesquisa para tarefas de NLP do AutoML.

NlpSweepSettings

Configurações de varredura para todas as tarefas de NLP do AutoML.

RegressionJob

Configuração do Trabalho de Regressão de AutoML.

Inicialize uma nova tarefa de Regressão de AutoML.

SearchSpace

Classe SearchSpace para verticais de AutoML.

StackEnsembleSettings

Configuração avançada para personalizar a execução do StackEnsemble.

TabularFeaturizationSettings

Configurações de definição de recursos para um trabalho de AutoML.

TabularLimitSettings

Limitar as configurações de uma Tabela AutoML Vertical.

TextClassificationJob

Configuração do trabalho de classificação de texto do AutoML.

Inicializa uma nova tarefa de Classificação de Texto AutoML.

TextClassificationMultilabelJob

Configuração do trabalho de classificação de texto multilódigo de classificação de texto do AutoML.

Inicializa uma nova tarefa de Classificação de Texto AutoML Multi-rótulo.

TextNerJob

Configuração do trabalho NER de Texto NER do AutoML.

Inicializa uma nova tarefa NER de Texto AutoML.

TrainingSettings

Classe TrainingSettings para o Azure Machine Learning.

Classe TrainingSettings para o Azure Machine Learning.

Enumerações

BlockedTransformers

Enumeração para todos os modelos de classificação compatíveis com o AutoML.

ClassificationModels

Enumeração para todos os modelos de classificação compatíveis com o AutoML.

ClassificationMultilabelPrimaryMetrics

Métricas primárias para tarefas de classificação de vários rótulos.

ClassificationPrimaryMetrics

Métricas primárias para tarefas de classificação.

FeaturizationMode

Modo de caracterização – determina o modo de recursos de dados.

ForecastHorizonMode

Enumerar para determinar o modo de seleção do horizonte de previsão.

ForecastingModels

Enumeração para todos os modelos de previsão compatíveis com o AutoML.

ForecastingPrimaryMetrics

Métricas primárias para a tarefa Previsão.

InstanceSegmentationPrimaryMetrics

Métricas primárias para tarefas instanceSegmentation.

LearningRateScheduler

Enumeração do agendador de taxa de aprendizagem.

LogTrainingMetrics

Contém classes de machine learning automatizadas para o SDKv2 do Azure Machine Learning.

As principais áreas incluem o gerenciamento de tarefas de AutoML.

LogValidationLoss

Contém classes de machine learning automatizadas para o SDKv2 do Azure Machine Learning.

As principais áreas incluem o gerenciamento de tarefas de AutoML.

NCrossValidationsMode

Determina como o valor das validações N-Cross é determinado.

ObjectDetectionPrimaryMetrics

Métricas primárias para a tarefa Image ObjectDetection.

RegressionModels

Enumeração para todos os modelos de regressão compatíveis com o AutoML.

RegressionPrimaryMetrics

Métricas primárias para a tarefa Regressão.

SamplingAlgorithmType

Contém classes de machine learning automatizadas para o SDKv2 do Azure Machine Learning.

As principais áreas incluem o gerenciamento de tarefas de AutoML.

ShortSeriesHandlingConfiguration

O parâmetro que define como o AutoML deve lidar com uma série temporal curta.

StochasticOptimizer

Otimizador stocástico para modelos de imagem.

TargetAggregationFunction

Função de agregação de destino.

TargetLagsMode

O destino atrasa os modos de seleção.

TargetRollingWindowSizeMode

Modo de tamanho de janela sem interrupção de destino.

UseStl

Configure a Decomposição de STL da coluna de destino da série temporal.

ValidationMetricType

Método de computação de métrica a ser usado para métricas de validação em tarefas de imagem.

Funções

classification

Função para criar um ClassificationJob.

Um trabalho de classificação é usado para treinar um modelo que melhor preveja a classe de um exemplo de dados. Vários modelos são treinados usando os dados de treinamento. O modelo com o melhor desempenho nos dados de validação com base na métrica primária é selecionado como o modelo final.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Parâmetros

training_data
Input

Os dados de treinamento a serem usados no experimento. Devem conter recursos de treinamento e uma coluna de rótulo (opcionalmente, uma coluna de pesos de amostra).

target_column_name
str

O nome da coluna de rótulo. Esse parâmetro é aplicável aos training_dataparâmetros e validation_datatest_data

primary_metric

A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: precisão, AUC_weighted, norm_macro_recall, average_precision_score_weighted e padrões de precision_score_weighted para precisão

enable_model_explainability
bool

Se deve habilitar a explicação do melhor modelo do AutoML no final de todas as iterações de treinamento do AutoML. A opção padrão é Nenhum. Para obter mais informações, consulte Interpretabilidade: explicações de modelo no machine learning automatizado.

weight_column_name
str

O nome da coluna de peso de amostra. O ML Automatizado oferece suporte a uma coluna ponderada como uma entrada, fazendo com que as linhas nos dados sejam ponderadas para cima ou para baixo. Se os dados de entrada são de um pandas.DataFrame que não tem nomes de coluna, os índices de coluna podem ser usados, expressos como inteiros.

Esse parâmetro é aplicável aos training_data parâmetros e validation_data

validation_data
Input

Os dados de validação a serem usados no experimento. Devem conter recursos de treinamento e uma coluna de rótulo (opcionalmente, uma coluna de pesos de amostra).

Padrão como Nenhum

validation_data_size
float

Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.

Especifique validation_data para fornecer dados de validação; caso contrário, defina n_cross_validations ou validation_data_size para extrair os dados de validação dos dados de treinamento especificados. Para a dobra de validação cruzada personalizada, use cv_split_column_names.

Para obter mais informações, consulte Configurar divisões de dados e validação cruzada no machine learning automatizado.

Padrão como Nenhum

n_cross_validations
Union[str, int]

Quantas validações cruzadas devem ser executadas quando os dados de validação do usuário não são especificados.

Especifique validation_data para fornecer dados de validação; caso contrário, defina n_cross_validations ou validation_data_size para extrair os dados de validação dos dados de treinamento especificados. Para a dobra de validação cruzada personalizada, use cv_split_column_names.

Para obter mais informações, consulte Configurar divisões de dados e validação cruzada no machine learning automatizado.

Padrão como Nenhum

cv_split_column_names
List[str]

Lista de nomes das colunas que contêm divisão de validação cruzada personalizada. Cada uma das colunas de divisão CV representa uma divisão CV, em que cada linha é marcada como 1 para treinamento ou 0 para validação.

Padrão como Nenhum

test_data
Input

O recurso Teste de Modelo que usa conjuntos de dados de teste ou divisões de dados de teste é um recurso no estado Versão Prévia e pode mudar a qualquer momento. Os dados de teste a serem usados para uma execução de teste que serão iniciados automaticamente após a conclusão do treinamento do modelo. A execução de teste terá previsões usando o melhor modelo e calculará métricas considerando essas previsões.

Se esse parâmetro ou o parâmetro test_data_size não for especificado, nenhuma execução de teste será feita automaticamente após a conclusão do treinamento do modelo. Os dados de teste devem conter os recursos e a coluna de rótulo. Se test_data for especificado, o parâmetro target_column_name deverá ser especificado.

Padrão como Nenhum

test_data_size
float

O recurso Teste de Modelo que usa conjuntos de dados de teste ou divisões de dados de teste é um recurso no estado Versão Prévia e pode mudar a qualquer momento. Qual fração dos dados de treinamento deve ser mantida para dados de teste em uma execução de teste que será iniciada automaticamente após a conclusão do treinamento do modelo. A execução de teste terá previsões usando o melhor modelo e calculará métricas considerando essas previsões.

Isso deve estar entre 0,0 e 1,0 não inclusivo. Se test_data_size for especificado ao mesmo tempo que validation_data_size, os dados de teste serão divididos de training_data antes da divisão dos dados de validação. Por exemplo, se validation_data_size=0.1, test_data_size=0.1 e os dados de treinamento originais tiverem 1000 linhas, os dados de teste terão 100 linhas, os dados de validação terão 90 linhas e os dados de treinamento terão 810 linhas.

Para tarefas de regressão, usa-se a amostragem aleatória. Para tarefas de classificação, a amostragem estratificada é usada. No momento, a previsão não é compatível com a especificação de um conjunto de dados de teste usando uma divisão de treinamento/teste.

Se esse parâmetro ou o parâmetro test_data não for especificado, nenhuma execução de teste será feita automaticamente após a conclusão do treinamento do modelo.

Padrão como Nenhum

Retornos

Um objeto de trabalho que pode ser enviado a uma computação do Azure ML para execução.

Tipo de retorno

forecasting

Função para criar um trabalho de Previsão.

Uma tarefa de previsão é usada para prever valores de destino para um período de tempo futuro com base nos dados históricos. Vários modelos são treinados usando os dados de treinamento. O modelo com o melhor desempenho nos dados de validação com base na métrica primária é selecionado como o modelo final.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Parâmetros

training_data
Input

Os dados de treinamento a serem usados no experimento. Devem conter recursos de treinamento e uma coluna de rótulo (opcionalmente, uma coluna de pesos de amostra).

target_column_name
str

O nome da coluna de rótulo. Esse parâmetro é aplicável aos training_dataparâmetros e validation_datatest_data

primary_metric

A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Padrões para normalized_root_mean_squared_error

enable_model_explainability
bool

Se deve habilitar a explicação do melhor modelo do AutoML no final de todas as iterações de treinamento do AutoML. A opção padrão é Nenhum. Para obter mais informações, consulte Interpretabilidade: explicações de modelo no machine learning automatizado.

weight_column_name
str

O nome da coluna de peso de amostra. O ML Automatizado oferece suporte a uma coluna ponderada como uma entrada, fazendo com que as linhas nos dados sejam ponderadas para cima ou para baixo. Se os dados de entrada são de um pandas.DataFrame que não tem nomes de coluna, os índices de coluna podem ser usados, expressos como inteiros.

Esse parâmetro é aplicável aos training_data parâmetros e validation_data

validation_data
Input

Os dados de validação a serem usados no experimento. Devem conter recursos de treinamento e uma coluna de rótulo (opcionalmente, uma coluna de pesos de amostra).

Padrão como Nenhum

validation_data_size
float

Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.

Especifique validation_data para fornecer dados de validação; caso contrário, defina n_cross_validations ou validation_data_size para extrair os dados de validação dos dados de treinamento especificados. Para a dobra de validação cruzada personalizada, use cv_split_column_names.

Para obter mais informações, consulte Configurar divisões de dados e validação cruzada no machine learning automatizado.

Padrão como Nenhum

n_cross_validations
Union[str, int]

Quantas validações cruzadas devem ser executadas quando os dados de validação do usuário não são especificados.

Especifique validation_data para fornecer dados de validação; caso contrário, defina n_cross_validations ou validation_data_size para extrair os dados de validação dos dados de treinamento especificados. Para a dobra de validação cruzada personalizada, use cv_split_column_names.

Para obter mais informações, consulte Configurar divisões de dados e validação cruzada no machine learning automatizado.

Padrão como Nenhum

cv_split_column_names
List[str]

Lista de nomes das colunas que contêm divisão de validação cruzada personalizada. Cada uma das colunas de divisão CV representa uma divisão CV, em que cada linha é marcada como 1 para treinamento ou 0 para validação.

Padrão como Nenhum

test_data
Input

O recurso Teste de Modelo que usa conjuntos de dados de teste ou divisões de dados de teste é um recurso no estado Versão Prévia e pode mudar a qualquer momento. Os dados de teste a serem usados para uma execução de teste que serão iniciados automaticamente após a conclusão do treinamento do modelo. A execução de teste terá previsões usando o melhor modelo e calculará métricas considerando essas previsões.

Se esse parâmetro ou o parâmetro test_data_size não for especificado, nenhuma execução de teste será feita automaticamente após a conclusão do treinamento do modelo. Os dados de teste devem conter os recursos e a coluna de rótulo. Se test_data for especificado, o parâmetro target_column_name deverá ser especificado.

Padrão como Nenhum

test_data_size
float

O recurso Teste de Modelo que usa conjuntos de dados de teste ou divisões de dados de teste é um recurso no estado Versão Prévia e pode mudar a qualquer momento. Qual fração dos dados de treinamento deve ser mantida para dados de teste em uma execução de teste que será iniciada automaticamente após a conclusão do treinamento do modelo. A execução de teste terá previsões usando o melhor modelo e calculará métricas considerando essas previsões.

Isso deve estar entre 0,0 e 1,0 não inclusivo. Se test_data_size for especificado ao mesmo tempo que validation_data_size, os dados de teste serão divididos de training_data antes da divisão dos dados de validação. Por exemplo, se validation_data_size=0.1, test_data_size=0.1 e os dados de treinamento originais tiverem 1000 linhas, os dados de teste terão 100 linhas, os dados de validação terão 90 linhas e os dados de treinamento terão 810 linhas.

Para tarefas de regressão, usa-se a amostragem aleatória. Para tarefas de classificação, a amostragem estratificada é usada. No momento, a previsão não é compatível com a especificação de um conjunto de dados de teste usando uma divisão de treinamento/teste.

Se esse parâmetro ou o parâmetro test_data não for especificado, nenhuma execução de teste será feita automaticamente após a conclusão do treinamento do modelo.

Padrão como Nenhum

forecasting_settings
ForecastingSettings

As configurações da tarefa de previsão

Retornos

Um objeto de trabalho que pode ser enviado a uma computação do Azure ML para execução.

Tipo de retorno

image_classification

Cria um objeto para o trabalho classificação de várias classes de imagem autoML.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Parâmetros

training_data
Input

Os dados de treinamento a serem usados no experimento.

target_column_name
str

O nome da coluna de rótulo. Esse parâmetro é aplicável aos parâmetros training_data e validation_data.

primary_metric

A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: precisão, AUC_weighted, norm_macro_recall, average_precision_score_weighted e precision_score_weighted Padrões de precisão.

validation_data
Input

Os dados de validação a serem usados no experimento.

validation_data_size
float

Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.

Especifique validation_data para fornecer dados de validação, caso contrário, defina validation_data_size para extrair dados de validação dos dados de treinamento especificados.

O padrão é .2

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Retornos

Objeto de trabalho de classificação de imagem que pode ser enviado a uma computação do Azure ML para execução.

Tipo de retorno

image_classification_multilabel

Cria um objeto para o trabalho classificação de vários rótulos de Imagem AutoML.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Parâmetros

training_data
Input

Os dados de treinamento a serem usados no experimento.

target_column_name
str

O nome da coluna de rótulo. Esse parâmetro é aplicável aos parâmetros training_data e validation_data.

primary_metric

A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: precisão, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted e Iou Defaults to Iou.

validation_data
Input

Os dados de validação a serem usados no experimento.

validation_data_size
float

Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.

Especifique validation_data para fornecer dados de validação, caso contrário, defina validation_data_size para extrair dados de validação dos dados de treinamento especificados.

O padrão é .2

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Retornos

Objeto de trabalho de classificação de vários rótulos de imagem que pode ser enviado para uma computação do Azure ML para execução.

Tipo de retorno

image_instance_segmentation

Cria um objeto para o trabalho de Segmentação de Instância de Imagem do AutoML.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Parâmetros

training_data
Input

Os dados de treinamento a serem usados no experimento.

target_column_name
str

O nome da coluna de rótulo. Esse parâmetro é aplicável aos parâmetros training_data e validation_data.

primary_metric

A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

Os dados de validação a serem usados no experimento.

validation_data_size
float

Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.

Especifique validation_data para fornecer dados de validação, caso contrário, defina validation_data_size para extrair dados de validação dos dados de treinamento especificados.

O padrão é .2

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Retornos

Trabalho de segmentação de instância de imagem

Tipo de retorno

image_object_detection

Cria um objeto para o trabalho de Detecção de Objeto de Imagem AutoML.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Parâmetros

training_data
Input

Os dados de treinamento a serem usados no experimento.

target_column_name
str

O nome da coluna de rótulo. Esse parâmetro é aplicável aos parâmetros training_data e validation_data.

primary_metric

A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

Os dados de validação a serem usados no experimento.

validation_data_size
float

Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.

Especifique validation_data para fornecer dados de validação, caso contrário, defina validation_data_size para extrair dados de validação dos dados de treinamento especificados.

O padrão é .2

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Retornos

Objeto de trabalho de detecção de objeto de imagem que pode ser enviado para uma computação do Azure ML para execução.

Tipo de retorno

regression

Função para criar um trabalho de regressão.

Um trabalho de regressão é usado para treinar um modelo para prever valores contínuos de uma variável de destino de um conjunto de dados. Vários modelos são treinados usando os dados de treinamento. O modelo com o melhor desempenho nos dados de validação com base na métrica primária é selecionado como o modelo final.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Parâmetros

training_data
Input

Os dados de treinamento a serem usados no experimento. Devem conter recursos de treinamento e uma coluna de rótulo (opcionalmente, uma coluna de pesos de amostra).

target_column_name
str

O nome da coluna de rótulo. Esse parâmetro é aplicável aos training_dataparâmetros e validation_datatest_data

primary_metric

A métrica que o Machine Learning Automatizado otimizará para a seleção de modelo. O Machine Learning Automatizado coleta mais métricas do que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: spearman_correlation, r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error. O padrão é normalized_root_mean_squared_error

enable_model_explainability
bool

Se deve habilitar a explicação do melhor modelo do AutoML no final de todas as iterações de treinamento do AutoML. A opção padrão é Nenhum. Para obter mais informações, consulte Interpretabilidade: explicações de modelo no machine learning automatizado.

weight_column_name
str

O nome da coluna de peso de amostra. O ML Automatizado oferece suporte a uma coluna ponderada como uma entrada, fazendo com que as linhas nos dados sejam ponderadas para cima ou para baixo. Se os dados de entrada são de um pandas.DataFrame que não tem nomes de coluna, os índices de coluna podem ser usados, expressos como inteiros.

Esse parâmetro é aplicável aos training_data parâmetros e validation_data

validation_data
Input

Os dados de validação a serem usados no experimento. Devem conter recursos de treinamento e uma coluna de rótulo (opcionalmente, uma coluna de pesos de amostra).

Padrão como Nenhum

validation_data_size
float

Qual fração dos dados deve ser mantida para validação quando os dados de validação do usuário não são especificados. Isso deve estar entre 0,0 e 1,0 não inclusivo.

Especifique validation_data para fornecer dados de validação; caso contrário, defina n_cross_validations ou validation_data_size para extrair os dados de validação dos dados de treinamento especificados. Para a dobra de validação cruzada personalizada, use cv_split_column_names.

Para obter mais informações, consulte Configurar divisões de dados e validação cruzada no machine learning automatizado.

Padrão como Nenhum

n_cross_validations
Union[str, int]

Quantas validações cruzadas devem ser executadas quando os dados de validação do usuário não são especificados.

Especifique validation_data para fornecer dados de validação; caso contrário, defina n_cross_validations ou validation_data_size para extrair os dados de validação dos dados de treinamento especificados. Para a dobra de validação cruzada personalizada, use cv_split_column_names.

Para obter mais informações, consulte Configurar divisões de dados e validação cruzada no machine learning automatizado.

Padrão como Nenhum

cv_split_column_names
List[str]

Lista de nomes das colunas que contêm divisão de validação cruzada personalizada. Cada uma das colunas de divisão CV representa uma divisão CV, em que cada linha é marcada como 1 para treinamento ou 0 para validação.

Padrão como Nenhum

test_data
Input

O recurso Teste de Modelo que usa conjuntos de dados de teste ou divisões de dados de teste é um recurso no estado Versão Prévia e pode mudar a qualquer momento. Os dados de teste a serem usados para uma execução de teste que serão iniciados automaticamente após a conclusão do treinamento do modelo. A execução de teste terá previsões usando o melhor modelo e calculará métricas considerando essas previsões.

Se esse parâmetro ou o parâmetro test_data_size não for especificado, nenhuma execução de teste será feita automaticamente após a conclusão do treinamento do modelo. Os dados de teste devem conter os recursos e a coluna de rótulo. Se test_data for especificado, o parâmetro target_column_name deverá ser especificado.

Padrão como Nenhum

test_data_size
float

O recurso Teste de Modelo que usa conjuntos de dados de teste ou divisões de dados de teste é um recurso no estado Versão Prévia e pode mudar a qualquer momento. Qual fração dos dados de treinamento deve ser mantida para dados de teste em uma execução de teste que será iniciada automaticamente após a conclusão do treinamento do modelo. A execução de teste terá previsões usando o melhor modelo e calculará métricas considerando essas previsões.

Isso deve estar entre 0,0 e 1,0 não inclusivo. Se test_data_size for especificado ao mesmo tempo que validation_data_size, os dados de teste serão divididos de training_data antes da divisão dos dados de validação. Por exemplo, se validation_data_size=0.1, test_data_size=0.1 e os dados de treinamento originais tiverem 1000 linhas, os dados de teste terão 100 linhas, os dados de validação terão 90 linhas e os dados de treinamento terão 810 linhas.

Para tarefas de regressão, usa-se a amostragem aleatória. Para tarefas de classificação, a amostragem estratificada é usada. No momento, a previsão não é compatível com a especificação de um conjunto de dados de teste usando uma divisão de treinamento/teste.

Se esse parâmetro ou o parâmetro test_data não for especificado, nenhuma execução de teste será feita automaticamente após a conclusão do treinamento do modelo.

Padrão como Nenhum

Retornos

Um objeto de trabalho que pode ser enviado a uma computação do Azure ML para execução.

Tipo de retorno

text_classification

Função para criar um TextClassificationJob.

Um trabalho de classificação de texto é usado para treinar um modelo que pode prever a classe/categoria de dados de texto. Os dados de treinamento de entrada devem incluir uma coluna de destino que classifique o texto em exatamente uma classe.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Parâmetros

training_data
Input

Os dados de treinamento a serem usados no experimento. Ele deve conter recursos de treinamento e uma coluna de destino.

target_column_name
str

Nome da coluna de destino.

validation_data
Input

Os dados de validação a serem usados no experimento. Ele deve conter recursos de treinamento e uma coluna de destino.

primary_metric
Union[str, ClassificationPrimaryMetrics]

Métrica primária para a tarefa. Valores aceitáveis: precisão, AUC_weighted, precision_score_weighted

log_verbosity
str

Nível de detalhamento de log.

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Retornos

O objeto TextClassificationJob.

Tipo de retorno

text_classification_multilabel

Função para criar um TextClassificationMultilabelJob.

Um trabalho de classificação de texto com vários rótulos é usado para treinar um modelo que pode prever as classes/categorias de dados de texto. Os dados de treinamento de entrada devem incluir uma coluna de destino que classifique o texto em class(es). Para obter mais informações sobre o formato de dados de vários rótulos, consulte: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Parâmetros

training_data
Input

Os dados de treinamento a serem usados no experimento. Ele deve conter recursos de treinamento e uma coluna de destino.

target_column_name
str

Nome da coluna de destino.

validation_data
Input

Os dados de validação a serem usados no experimento. Ele deve conter recursos de treinamento e uma coluna de destino.

primary_metric
str

Métrica primária para a tarefa. Valores aceitáveis: precisão

log_verbosity
str

Nível de detalhamento de log.

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Retornos

O objeto TextClassificationMultilabelJob.

Tipo de retorno

text_ner

Função para criar um TextNerJob.

Um trabalho de reconhecimento de entidade chamado de texto é usado para treinar um modelo que pode prever as entidades nomeadas no texto. Os dados de treinamento de entrada devem ser um arquivo de texto no formato CoNLL. Para obter mais informações sobre o formato de dados NER de texto, consulte: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Parâmetros

training_data
Input

Os dados de treinamento a serem usados no experimento. Ele deve conter recursos de treinamento e uma coluna de destino.

validation_data
Input

Os dados de validação a serem usados no experimento. Ele deve conter recursos de treinamento e uma coluna de destino.

primary_metric
str

Métrica primária para a tarefa. Valores aceitáveis: precisão

log_verbosity
str

Nível de detalhamento de log.

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Retornos

O objeto TextNerJob.

Tipo de retorno